69书吧最新网址:www.69hao.com
首页 > 精品推荐 > 学霸的征途是星辰大海 > 第133章 符號逻辑推理的数学模型

第133章 符號逻辑推理的数学模型(2/2)

目录
好书推荐: 梁朝九皇子 救命!高冷女总裁赖在我家不走了 六零年代,冷清妍的逆光人生 四合院,傻柱你爸被你哥送去当兵 大唐:让你教太子,没让你套麻袋 四合院我能无限合成 人在玄幻,给我无限弹药什么鬼 末日车队,让子弹在公路上飞一会 序列车队:求生纪元 家族修仙:从打下小型位面开始

“但数学家的数学好,是指他们能洞察这些公式背后的『结构』与『本质』。”

……

五天后。

当徐辰关掉最后一节关於“transformer架构源码解析”的网课视频时,他长长地舒了一口气。

海量的知识,从最底层的感知机,到最前沿的大语言模型,在他的脑海中,构建起了一座宏伟的知识大厦。

【叮!】

【检测到宿主系统性地掌握了“深度学习与自然语言处理”的核心知识体系。】

【信息学经验值+20!】

【当前信息学等级:lv.0 (35/100)】

看著那猛涨了一截的经验条,徐辰並没有太多的惊讶。

对於一个已经站在数学lv.2高度的人来说,ai的底层逻辑並不神秘。拋开工程实现的细节,现代深度学习的本质,就是在一个极高维的参数空间里,寻找一个能够擬合数据分布的流形。

“现在,地基已经打好了。”

徐辰的目光,投向了系统物品栏里那份名为《具备逻辑推理与长时记忆模块的改进型大语言模型算法框架(laart)》的“草稿”。

他將其提取出来,仔细研读。

这份“草稿”並没有直接给出成型的代码,它更像是一份来自未来的“技术白皮书”,指出了三个核心模块。徐辰决定,先攻克最核心的——符號逻辑推理模块(slrm)。

目前的ai界,为了解决大模型的“幻觉”问题,即一本正经地胡说八道,主流做法是rlhf,也就是基於人类反馈的强化学习。但这本质上是让人类去“教”鸚鵡说话,鸚鵡並不懂真理,它只是学会了迎合人类的口味。

徐辰翻开草稿的“逻辑推理”章节,眼神逐渐变得凝重。

草稿上写著这样一段话:

“不要试图在离散的符號层面去强行嫁接逻辑规则。应当將一阶谓词逻辑的语法树,通过某种拓扑变换,嵌入到连续的向量空间中。使得逻辑推演的过程,等价於向量空间中的几何变换。”

“建议路径:採用区域表示法。將每个概念视为高维空间的一个闭区域。逻辑蕴含即为几何包含。”

“关键模型参考:箱嵌入……”

然而,写到这里,草稿就像是被撕掉了一半似的,戛然而止。

后面关於如何构建这个“box”,如何处理梯度的反向传播,以及最关键的损失函数设计,全是一片空白。

“系统,你这是断章狗行为啊……”

徐辰忍不住吐槽了一句。

不过,这也激起了他的好胜心。既然方向已经指明了,剩下的路,自己走不出来吗?

他在草稿纸上画了一个简单的示意图,顺著草稿的思路继续推演。

“把逻辑关係,映射成几何关係……box embeddings……”

徐辰的笔尖在纸上重重一点。

“明白了!系统的意思是,我们要把每一个概念,比如『猫』、『动物』、『生物』,都不看作是一个点,而是看作高维空间里的一个长方形盒子(box)。”

他在纸上画了几个大小不一的矩形框。

“逻辑的本质是什么?是包含与被包含。”

“如果『猫』蕴含『动物』这个概念,那么在几何空间里,代表『猫』的那个小盒子,就必须完完全全地被塞进代表『动物』的大盒子里!”

“如果ai生成了一句话,说『猫不是动物』,那么在它的向量空间里,这两个盒子就会出现分离。这时候,我们只需要计算这两个盒子的交集体积。”

“体积为零,或者重叠率极低,就说明——逻辑矛盾!”

徐辰的眼睛越来越亮。

这简直就是天才的设计!

通过这种方式,他相当於在传统的概率预测模型里,植入了一个冷酷无情的“逻辑判官”。

每当ai想要“胡说八道”时,这个逻辑判官就会瞬间计算出几何关係:

“停!根据几何计算,『a盒子』和『b盒子』没有交集,这句话逻辑不通,禁止输出!”

这將从根本上解决大模型的幻觉问题!

基於这个理解,徐辰迅速补全了草稿中缺失的核心公式:

box(c, w)={x | c - w/2≤ x≤ c + w/2} p(a|b)= vol(box(a)n box(b))/ vol(box(b))

“这个模型很简单,也很有效。它把复杂的逻辑运算转化为了极其廉价的『min/max』运算,非常適合gpu並行加速。”

“但也存在一个明显的缺陷。”

徐辰看著自己补全的公式,敏锐地指出了问题所在,体现出了他作为数学家的严谨。

“数值稳定性是个大问题。当你不断对盒子求交集做逻辑与运算,盒子的体积会指数级缩小。在计算机的浮点数表示下,很快就会变成0,导致梯度消失,模型无法继续学习。”

“这就像是把一张大饼不断对摺,折到最后就没法看了。”

“而且,『超矩形』虽然计算简单,但它比较刚性,难以表达某些复杂的环状逻辑。”

草稿里虽然没提这些,但徐辰凭藉lv.2的数学直觉,一眼就看穿了这个初级模型的局限。

“真正的终极形態,应该是一个基於『李群』流形的动態拓扑结构,甚至是某种非交换几何。”

徐辰摸了摸下巴,若有所思。

“不过,对於目前的初级版本来说,只要能跑通就行。先造一把趁手的『土枪』,能响就行。至於那些高大上的流形结构,等以后算力够了、时间充裕了再慢慢升级。”

打定主意后,徐辰不再犹豫。

他需要在前往德国之前,把这套逻辑验证代码跑通。

“好,开工!”

目录
新书推荐: 四合院开局收傻柱当儿子 我,枪神! 重生1972长白山之救赎 长生从觉醒异能开始 四合院:工业强国路 大唐李承乾,提弟弟人头质问李二 综艺摆烂,一首过火唱哭前女友 人在高武,老婆修炼我享福 让你上综艺普法,你把顶流送进去 我都这么渣了,你们竟然不介意?
返回顶部