日排行周排行月排行日推荐周推荐月推荐

佩奇小说网>科研系学霸>第67章 QA

何凯明也很好奇周昀会怎么回答这个问题,于是他看向台上,结果对方的反应倒是有些出乎他的预料。

周昀的眼神中没有丝毫的慌乱,反倒是有些。。。。。。兴奋?

其实这个问题周昀自己也问过自己,他本来还想着如果没人提出这个问题,自己是不是要在报告的时候提一下,毕竟这个点确实非常重要。

不过最后还是没有加到前面的报告里,主要是之前报告要讲的都已经确定了,再加上这一段,时间上可能会超。

现在有人提出来,正合他的心意。

“何教授,非常感谢您如此深刻的提问,这确实是我的工作中最需要谨慎对待的部分。

您提到的‘无限递归’风险,在任何自指系统中都是理论上存在的。

为了规避这一点并确保系统的收敛与可靠,我们引入了一个基于博弈论和不动点理论的混合数学框架。”

这就是为什么周昀在一开始要学习数学的原因了,一个良好的数学功底,真的能在很多时候帮忙解决一些关键性的问题。

周昀看了眼时间,应该够了。

他用电脑创建了一个白板,然后开始用鼠标作画,虽然有点抽象,但是配合他的讲解,也算能勉强看的懂。

“首先,我们将‘被压缩的AI模型’与‘负责调教的AI元模型’之间的关系,形式化为一个非零和合作博弈。

‘被压缩的AI模型’选择一组模型参数θ目标是在给定的压缩约束下最小化任务损失函数L_task,

而‘负责调教的AI元模型’选择一种压缩策略φ,目标是最小化一个元损失函数L_meta,

这样就能得到一个组合的惩罚项,也就是一般模型里的损失函数L_meta=L_task+λR,

我们并不追求一个无限递归的最优,而是试图找到一个平衡,这正是一个纳什均衡点的概念。

之后我设计了一个交替优化算法来逼近这个均衡点,其迭代过程可以假设地抽象为一个映射T:->

。。。。。。

经过以上的过程,我们就可以证明T确实是压缩映射,根据Banach不动点定理,

这个映射就存在唯一的不动点,并且无论从任何初始点开始迭代,

该算法都会以线性收敛速度全局收敛到这个唯一的不动点。

而这个不动点正是我们寻求的纳什均衡。”

其实说到一半的时候大部分人就已经跟不上周昀的思路了,毕竟不是数学系的,

对于这种数学证明,大部分人都不是特别擅长,更别说周昀这个证明也没那么简单。

不过何凯明倒是能跟得上,毕竟他在从事计算机的研究之前,是水木大学物理系的学生,数学功底也会强一点。

周昀说完,再次向何凯明微微点头示意:“不知道这个解释是否回答了您的问题?”

书友推荐:娘娘总是体弱多病重生七零:糙汉老公掐腰宠在北宋当陪房岁岁平安浓精浇灌小白花(快穿 nph)房客(糙汉H)欲罢不能(男出轨、红帽女绿)潘多拉的复仇误入官路当明星从跑龙套开始重生少年猎美婚后心动:凌总追妻有点甜归雾龙凤猪旅行团以婚为名没你就不行之新征途梦中修仙:我有九个绝色道侣袅袅春腰触手怪她只想生存红颜政道
书友收藏:没你就不行之新征途成影帝了,系统才加载完女神攻略调教手册官途:权力巅峰吃了肉,就不能吃我了重生1958:发家致富从南锣鼓巷开始我的年轻岳母绝品宏图穿越崖山:我赵昺绝不跳海浓精浇灌小白花(快穿 nph)触手怪她只想生存神祇觉醒:谁说东方没有神明?龙族堕落调教陈思雅徐铁军官场之狐官途,搭上女领导之后!优质肉棒攻略系统(np高辣文)升迁之路就职供销社,我在60年代搞代购官场:救了女领导后,我一路飞升