本文由ChatGPT将文段、读书笔记规整或撰写成文。
看了两遍纪录片《香农传》(The Bit Player)。首次看时是单纯好奇。过了两年,因与人交谈“信息论”的问题,方才重温;有了系统学和复杂科学的基本认识,又带着问题而来,边看边记,有了许多新感悟。
语言的抽象层次与信息的极限
初读《香农传》时,我曾陷入一个问题的思考—语言究竟是怎样使人得以沟通的?那时,我把语言看作一种与电磁波、声波类似的媒介,是人类用来沟通与传递信息的工具。只要存在沟通,就必然要面对信息传输的难题:发送者如何表达,接收者如何理解。
我当时的理解是:抽象就是剔除个别特征,提取共同点来代表同类事物。语言符号的强大之处在于,它可以在不同的抽象层次上灵活运作。抽象层次越高,能够更简明地囊括更多具体事物,但随之而来的是理解的门槛提高,误解的机会增多。反之,停留在较低的具体层次,理解的人更多,但需要付出冗长、繁复的表述。就像同一个题目,可以在具体层次上与儿童讲述,也可以在抽象层次上与大学生讨论,效果差异源于所处的阶梯不同。
然而,当我把这些思考与《香农传》联系起来时,理解得到了进一步深化。香农用“信息源——发送器/编码器——信道——接收器/解码器——接收者”的通信模型,揭示了一个事实:语言作为信息传播的媒介,也面临编码、传输和解码的基本约束。
在这个框架下,语言表达的问题,实际上就是两个基本问题:
- 如何在保证理解的前提下,把信息“压缩”到最小必要体积?
- 如何在噪声与干扰中,最大限度地保证传递的可靠性?
毫无疑问,语言是一种特殊的信息传输形式。它既有自己的组织方式(概念、词句、段落),又存在抽象层次的区别。在实际交流中,人们一直试图在两个目标之间取得平衡:快速传输与尽量完整。
- 压缩是必要的:信息越简练,传输越高效。
- 丢失却不可避免:压缩过度,细节消失,甚至使得意义彻底模糊。
这就是语言表达中反复出现的张力。面对不同的受众,所选择的抽象层次必须不同:
- 对大众而言,过度抽象(例如充斥专业术语)会让语言失去传播意义;
- 对知识分子而言,过度具体反而显得冗长,他们更倾向于接收高度抽象化、压缩的信息。
换句话说,语言的传播效果,取决于抽象程度与受众理解力之间的匹配。
进一步地,我们可以说:语言存在“香农极限”。在语言传输过程中,影响交流效果的,不仅有信息本身的冗余度与压缩率,还有接收者的解码能力,以及上下文语境的补充。抽象层次越高,压缩率越大,误解率也随之升高。理解不仅依赖语言符号,还依赖于语境、情境和共同经验。
因此,语言不仅仅是一种符号游戏,而是一个完整的信息系统。正因如此,在政府治理和企业管理中,人们始终追求“政令畅通”、“令行禁止”。这实际上就是在追问:如何确保信息在传输中不走样,如何确保接收者能够准确解码,并最终转化为符合预期的行动。
语言是一种信息传输的特殊形式,它遵循香农所揭示的通信规律,却又因其承载人类经验与语境而显得复杂无比。
信息、熵与人类理解的边界
第二次回到《香农传》和香农的信息论,我有了新的思考。
“发现事物的模式,建立它的模型”。任何一件事物,如果要完成,必然有几个必要的步骤;而若要把事情做好,就必须进一步分解这些步骤,或增添新的环节,甚至改变原有的顺序。这些必要步骤,就是最小可行的方法,也就是最少必要行动。模式与模型,让我们得以用最简约的方式去理解复杂的过程。
世界的运行,本质上是一种二分法。矛盾存在于一切事物之中:可理解与不可理解、确定与不确定、信号与噪声。这种二元对立,正是信息论所依赖的基础逻辑。
信息之所以重要,在于它能消除不确定性。一次掷硬币,结果为正或反,就包含一个最基本的信息单元——比特。所有的信息最终都可以归约为0和1的组合,“存在”与“非存在”,“是”与“不是”。莎士比亚的“To be or not to be”,在信息论的语言中,就是一个最简单的二进制表达。
一旦信息的基本度量单位确立,问题就剩下两个:如何把事物转化为0与1,如何确保这些0与1能够准确传递。信息论的思考正是由此展开。如果一件事完全可以预测,它并不产生信息;而如果一件事完全随机,我们则需要无限的信息来描述它。信息的价值恰恰在于它介于两者之间:既不是全然必然,也不是彻底偶然,而是在有限不确定性中,给人以判断和行动的可能。
语言的运作揭示了另一层奥秘。人类的语言中充满冗余,语法规则和词序使得大量表达是可预测的。这意味着我们可以通过统计方法压缩信息,只传递那些无法预测的部分。香农用“熵”来刻画信息的本质:熵代表了信息在不丢失的前提下所能被压缩到的最小极限。冗余并非无用,它是抵御噪声的缓冲;但熵告诉我们,信息在压缩与冗余之间存在边界。
然而,通信过程并不只是抽象的数学推演。任何信道都有物理极限,噪声的存在会使信号翻转、消失或模糊。这就是香农提出“信道容量”与“香农极限”的缘由:信息传递速度一旦超过这一极限,就再也无法恢复有用的消息。爱因斯坦说物理速度不能超过光速,而香农则说信息传输不能超过信道极限。
超越极限,说话就等于没说,因为对方接收不到任何有效信息。这不仅是工程问题,也是人类交流的真实写照。一场对话、讲座,如果语速过快、信息量过大,听众反而什么也记不住;婚姻中的对话,若总是夹杂背景噪声,也往往导致误解。大声重复,并不等于沟通有效,真正关键在于选词与编码。就像在可能引发误解的表达后,补上一句“但我喜欢它”,就像加上一个防止错误的校验码。人类的交流本质上,就是在寻找逼近香农极限的编码方式。
香农不仅关注通信工程,也思考过人脑。他意识到,大脑处理信息并不只是传递,而是转化与评估。在棋局中,这种思想得到了具体体现。完整的棋局包含指数级的可能路径,无法穷举。但棋手只需有限前瞻几步,结合局面评估,就能筛掉大部分无效路径,减少不确定性,做出决策。这与信息论的精神惊人地一致:信息并非要穷尽真相,而是要在有限条件下,足以降低不确定性,支撑有效行动。
由此,一个基本的反馈循环应运而生:行动、反馈、分析、调整。这种循环正是人类社会的基本公理,也是情报分析、数据科学和组织管理的共同逻辑——人类的理性并不是全局预知,而是在有限信息窗口中,不断依赖反馈来修正与演化。
这种思路甚至延展到物理学最深的悖论——黑洞信息悖论。黑洞似乎吞噬了所有信息,蒸发出的霍金辐射与输入物质无关。信息看似丢失了,然而量子理论又坚持信息守恒。这种矛盾,若从系统学角度来看,可以理解为信息的层级转移:黑洞是一个黑箱,不同输入在输出层面被同化,但信息或许潜藏在更高层次的结构里。
类比到人类社会,制度就是一个“社会黑洞”。个体的多样性输入到制度中,往往被压缩成统一的规范和表象。表面上,个体差异似乎被抹平了;实际上,这些信息仍以潜在文化、非正式网络或历史惯习的形式残存,等待在另一层次显现。这就是所谓的“制度信息悖论”。信息看似消失,实则以另一种方式编码和保存。
后来,香农还用一篇论文证明:即便用有缺陷的元器件,也能构造出可靠的电路。这启发我们去理解人脑和人类组织:即使存在损伤,冗余的存在保证它们依然能够运作。人类的努力,也在于不断提炼出模式,把看似无解的问题转化为可被分解的小问题。
结语
熵与信息,构成人类理解世界的基本要素。它们属于物理与工程,也属于社会与人心。真正的智慧,是在有限的边界内,找到最小化不确定性的方法——寻找模式,建立模型,简化复杂性。信息论的价值正在于此:它提醒我们,信息不是“真理的全部”,而是“足以指导行动的度量”。
发表回复