从书报,录放机,电视机到智能手机,vr 眼镜,所有学习的,娱乐的工具或玩具,几乎都以光声诉诸视听,一块屏幕和一个喇叭。
视觉和听觉对任何动物都是收发信息的核心,诉诸视觉和听觉的光和声音在自然界客观存在,表现为光的漫反射和空气的震动,这些光影和声音连续弥漫在整个世界,人们沉浸其中,依靠它们通过定位,测量以理解世界。
相对而言,嗅觉,味觉和触觉是主观的,只有人们与之互动感受它们时才存在,世界上有固定可量化的光谱和震频,却无法量化 “臭”,“麻辣” 或 “疼”,可见一斑。
人们通过声音,表情和动作与他人互动,即便再嘈杂的环境也不妨碍人们察言观色,人们从来不会对说出去的话或做出的动作进行任何再干涉,大多数情况,人们每句话只要说一遍就够了,极少数情况下,人们会说 “什么?你再说一遍,我没听清”,人们几乎不会让人把肢体动作再做一遍,因为视觉的带宽比听觉更大,时延也更低,香农定律说人视觉抗噪能力更强,但听觉也不差。
声波和光进入耳朵和眼睛前不受任何影响,它们的局部以任意顺序被采样,但大脑却呈现出连续的时空。
…
当声光被计算机网络传输,最终也是要诉诸视听,但上面一切合理又简单逻辑却被遗忘了。人们倾向于获得不失真的信源副本。当信息有损时,企图通过传输协议从数据包中恢复丢失的信息,却不得不支付高昂的时延作为代价。
如果我们认真地,返璞归真地想一想声光在现实中是如何被我们传输并捕获的,事情会变得简单,但要达到这个简单的效果,编码是核心,这意味着可能一切都要重来,所以我这里只随便说说。
从意义中恢复,而不是从数据包中恢复。
声光都是连续的信息场,这是一种自带的 fec。音节和光影的模式是恢复的手段,当你听到 “我今天x上起床后有点不x服,又x下休息了,睡醒后发现已经 9 点了,结果x到了。” 所有的 x 都是可以补全的,因为我们的日常口语交流自带冗余,当你看到一幅被扣掉一块的画,你也几乎能脑补这个缺失的部分,这就是连续信息场的意义,从它们自带的连续局部性冗余中恢复损失的信息。
眼睛和耳朵感知的是编码,而不是传输协议。编码是有意义的,而传输协议只是一套冰冷的规则。
你有一堆沙子,你可以做出任何自带再生能力的造型,你有一堆半成品积木就只能做有限个僵硬造型,要么推倒重来,要么就是残缺的。通信和计算机遵循两套不一样的原则。
如果你坚持就是有些 “关键报文” 是绝对不能丢的,那就是你的编码不对,如果你坚持你的编码没问题,那就是你对。简单感受一下:
…
IM 其实是一种反自然的交流手段,是一种 “计算机式” 的手段,存储转发式的手段,发出信息后,对方没回复,发送者不得不再发一遍 “在吗”,后加入的 “已读” 功能将问题进一步复杂化而不是解决了问题,“已读” 可能意味着 “已读已忘”,日常交流不会这么 “反智”,明明是人与人的交流,却像 tcp timeout 一样 “不即时”,又偏偏叫 “即时通信”。
从真实的日常交流中学习实时声音和影像的传输,而不是从作为工具的计算机网络协议中引申,或许是个好的再出发起点。
浙江温州皮鞋湿,下雨进水不会胖。