内容传输和gw的结构匹配。”
\n
他说着走到讲台旁边,拉过一旁的白板,拿起笔开始边写边讲:“fgw的定义为:fgw_α(μ,ν,c_x,c_y,d)=(1-α)ot(μ,ν,d)+αgw(μ,ν,c_x,c_y),
\n
其中α∈[0,1]是融合参数,d是内容成本矩阵(如||x-y||^p),c_x和c_y是各自模态的内部相似矩阵,
\n
在非欧几里得空间中,比如视觉嵌入的球面流形或语言的超双曲空间,我将度量泛化为riemannian度量
\n
......
\n
不知道这是否能解决您的第一个问题?”
\n
浙大老师点点头:“可以了。”
\n
周昀点点头,将白板上的内容擦去:“好,那接下来我回答您的第二个问题。”
\n
马克笔不断在白板上写下各种奇怪的符号,至少在一些旁听的老师和学生眼里是这样的。
\n
“对于高维嵌入的数值稳定性,维度灾难会导致c_x和c_y的谱不稳定,我引入了谱正则化:对相似矩阵施加核范数罚项,min||c||*+λ||c-k||f^2
\n
......
\n
这样就能这确保了在噪声环境下,fgw的梯度下降不会发散,实验中在imagenet-1k上的鲁棒性提升了15%。”
\n
浙大老师并没有第一时间回答,而是重新翻到了论文的对应页面,看了一会儿才朝着周昀点了点头,眼里满是对周昀的欣赏:“我没问题了。”
\n
此时,车伟强也放下了手里的笔,朝周昀笑了笑:“周昀同学,你的论文写得非常扎实,理论深度就算是我都有些自愧不如,
本章未完,请点击下一页继续阅读! 第2页 / 共5页