分类

联邦学习中的全局干预与蒸馏方法用于分布外泛化

联邦学习中的属性偏移会导致本地模型专注于学习非因果关联,引导其朝向不一致的优化方向,从而不可避免地导致性能下降和不稳定收敛。现有方法通常利用数据增强来提高样本多样性或采用知识蒸馏来学习不变表示。然而,生成数据质量的不稳定性和缺乏领域信息限制了其在未见样本上的表现。为了解决这些问题,本文提出了一种名为FedGID的全局干预与蒸馏方法,该方法利用多样化的属性特征进行后门调整,以打破背景与标签之间的虚假关联。该方法包括两个主要模块:全局干预模块自适应地解耦图像中的对象和背景,并将背景信息注入随机样本中以干预样本分布,将背景与所有类别联系起来,防止模型将背景-标签关联视为因果关系;全局蒸馏模块利用统一的知识库指导客户端模型的表示学习,防止本地模型过度拟合到特定客户端的属性上。在三个数据集上的实验结果表明,FedGID增强了模型在未见数据中关注主体的能力,并在协作建模方面优于现有方法。

计算机视觉与模式识别
人工智能
2025-04-01 发布

大型语言模型在诊断学生数学问题解决中的认知技能研究

数学学习涉及内容知识的掌握以及对知识的理解、应用和推理的认知加工。自动化数学评估主要集中在通过查找文本证据(如特定数字、公式和陈述)来评价学生的内容知识展示。大型语言模型(LLMs)在解决问题、图像识别和推理能力方面的最新进展为细致评估学生的认知技能提供了可能性。诊断认知技能需要超越文本证据推断学生思维过程,这是基于LLMs的自动化评估中尚未充分探索的任务。本研究调查了最先进的LLMs如何诊断学生的数学认知技能。我们构建了MathCog,这是一个包含639名学生对110个由专家精心设计的中学数学问题的回答的新基准数据集,每个回答都附有基于认知技能清单的教师详细诊断。利用MathCog,我们评估了16种封闭式和开放式LLMs,涵盖不同规模和供应商。我们的评估结果显示,即使是最先进的LLMs在此任务上表现不佳,所有F1分数均低于0.5,并且在错误情况下表现出强烈的虚假自信(相关系数$r_s=.617$)。我们还发现模型规模与诊断性能正相关(相关系数$r_s=.771$)。最后,我们讨论了这些发现的意义、过度自信的问题以及改进自动化认知技能诊断的方向。

人工智能
人机交互
2025-04-01 发布

迪拉克和外尔粒子电磁相互作用的近期进展

本文综述了迪拉克和外尔粒子电磁相互作用研究领域的最新进展,并重点介绍了新颖且重要的发现。具体而言,我们证明了在广泛的电磁四势和场下,所有外尔粒子以及在特定条件下迪拉克粒子可以占据相同的量子态。这些无限数量的场已被明确推导并分析。此外,我们指出即使在没有外部电磁场的情况下,外尔粒子也可以形成局域化状态。并且,我们展示了通过施加简单的电场可以精确控制其局域化过程,提供了一种可调谐的调控机制。基于这些认识,我们提出了一种创新装置,利用外尔费米子实现高达每秒100拍比特的信息流调控。这一发现对下一代电子学和量子信息技术的发展具有重要意义,因为它为高速数据处理和传输提供了全新的方法。

量子物理
2025-04-01 发布

可数实数

我们构造了一个拓扑斯,在其中Dedekind实数是可数的。这个拓扑斯来源于一种新的实现性概念,我们称之为参数化实现性,基于部分组合代数,其应用依赖于参数。实现者在给定参数集上均匀操作。我们的构造使用了Joseph Miller发现的一组实数序列$[0,1]$,该序列在某种意义上是非对角化的,即任何从该序列的表示中一致oracle-可计算的实数必须已经出现在序列中。当将其用作参数集时,这将产生一个拓扑斯,在其中非对角化序列成为Dedekind实数的满射,从而使其内部可数。所得的拓扑斯是直觉主义的:它否定排中律和可数选择公理。然而,分析学的大部分内容在内部仍然成立。Cauchy实数是不可数的。Hilbert立方是可数的,因此Lawvere的理论可以推出布劳威尔不动点定理。中间值定理和弱排中律的解析形式成立,而弱排中律则不成立。虽然没有实值映射具有跳跃,但所有此类映射是否连续仍然是开放问题。最后,闭区间$[0,1]$,由于是可数的,可以用总长度小于任意$\epsilon > 0$的开区间的序列覆盖,且没有有限子覆盖。然而,我们证明了任何使用有理端点的区间进行的覆盖必须承认有限子覆盖。

数理逻辑
03B99, 03F55
2025-04-01更新2024-04-01 发布

小夸克质量下净重子数广义磁化率的普适临界行为

当小夸克质量极限下的三维Ising模型映射到QCD的$T-\mu_B$相平面时,温度轴与外加磁场方向之间的夹角随$m_q^{2/5}$趋于零。通过选取两个不同的小角度并将Ising模型结果投影到QCD上,我们研究了净重子数的六阶、八阶和十阶广义磁化率的普适临界行为。仅考虑主导临界贡献时,广义磁化率对$\mu_B$依赖关系中的负峰是非普适的,这与夹角为$90^{\circ}$的情况观察到的结果不同。其存在与否取决于映射参数以及远离相变线的距离。在纳入次主导临界贡献后,负峰在一定程度上被增强,但仍表现为非稳健特征。相比之下,正峰结构在所有情况下均保持存在,代表了接近临界点时净重子数广义磁化率的一个稳健特性。

原子核物理-理论
高能物理-唯象学
高能物理-理论
2025-04-01 发布

平衡二部图中随机匹配问题:体育抽签机制的(不)公平性

某些淘汰赛的分组抽签需要在平衡二部图中寻找完美匹配。当存在抽签约束时,体育比赛中常用的两种场 proven 方法被证明是非均匀分布的(可行匹配并非等概率出现),这可能威胁到公平性。我们针对合理大小的平衡二部图子集(最多16个节点),比较了这两种机制及其各自两种形式的偏差。在合理的限制条件下,发现一种机制在四分之一决赛抽签中优于其他所有机制。验证结果显示,欧洲冠军联赛16强抽签在2003/04至2023/24赛季期间采用了四种可用设计中的最佳方案。然而,这些随机化程序仍有很大的改进空间,特别是它们往往以相同的方向和大致相同的幅度扭曲概率。

物理与社会
应用
62-08, 90-10, 90B90, 91B14
2025-04-01更新2023-03-16 发布

标准Seesaw机制中无质量中微子的阈值效应

本文重新审视了非简并Seesaw尺度之间的单圈重正化群方程(RGEs),即标准Seesaw机制中的阈值效应,这一研究已超过二十年。不同于以往仅关注Weinberg算符的工作,我们推导了包含右手中微子的标准模型有效场论($\nu$SMEFT)中所有三个五维算符的完整单圈RGEs,并将其应用于标准Seesaw机制的阈值效应。我们发现了一些在先前计算中缺失的来自Weinberg算符对威尔逊系数、中微子杨-米尔斯耦合矩阵以及Higgs四次耦合的贡献。基于更新后的单圈RGEs,我们在没有任何近似的情况下推导出有效中微子质量矩阵行列式的RGE。首次严格证明了在最小类型I Seesaw机制或具有秩简并中微子杨-米尔斯耦合矩阵的典型Seesaw机制中,非简并Seesaw尺度之间的单圈RG运行效应不能为初始无质量中微子产生非零质量。必须引入二阶或更高阶修正才能使无质量中微子获得非零质量。

高能物理-唯象学
高能物理-实验
2025-04-01更新2024-05-28 发布

GPx4通过疏水锚定结合至过氧化膜

铁死亡是一种近年来发现的细胞死亡形式,由磷脂过度过氧化诱导。谷胱甘肽过氧化物酶4(GPx4)是一种可修复膜上过氧化磷脂的胞内酶,从而调控铁死亡。通过结合多尺度分子动力学(MD)模拟与实验测定,我们研究了GPx4与膜的结合机制。使用粗粒化MD模拟,我们发现GPx4上的L130及其相邻残基能够与富含PE/PS且过氧化的膜形成稳定且独特的结合界面。随后的全原子MD模拟验证了该结合界面的稳定性。结合界面上的关键残基L130插入膜内作为疏水锚,引导反应中心靠近膜表面。酶活性测定和体外细胞实验表明,L130突变会削弱酶活性,这可能源于GPx4在膜上的非功能性结合模式,如计算机模拟所示。本研究表明疏水残基L130在GPx4正确锚定于膜上的关键作用,这是其膜修复功能的第一步。

生物分子
2025-04-01更新2025-03-30 发布

具有超均匀性或巨数涨落系统的渗流

我们通过二维(2D)Ashkin-Teller模型的局域能量阈值化生成点分布(P Cs),并通过改变控制粒子密度ρ的阈值,在临界Baxter线的不同λ值处研究渗流转变。对于所有λ值,点分布均表现出幂律相关性,其衰减指数a独立于ρ,并随λ连续变化。当λ < 0时,点分布为超均匀,其渗流临界行为与普通渗流相同。相比之下,当λ > 0时,点分布表现出巨数涨落,所有临界指数连续变化,但在2D中形成一个超普适渗流转变类。

统计力学
2025-04-01 发布

带状态约束的反馈优化:通过控制屏障函数

近年来,关于一类称为反馈优化的方法的研究呈增长趋势。这些方法旨在将控制系统的状态引导至一个平衡点,该平衡点作为优化问题的解出现。尽管关于这一主题的文献日益增多,但如何在所有时间都满足状态约束这一重要问题仍未得到解决。在这项工作中,我们提出了首个能够满足状态约束的反馈优化方法。该方法结合了一类称为安全梯度流的动力学和高阶控制屏障函数。我们对所提出的控制器提供了一系列结果,包括适定性保证、随时满足约束的保证、闭环平衡点与优化问题临界点之间的等价性,以及最优值的局部渐近稳定性。

优化与控制
cs.SY
系统与控制
2025-04-01 发布

协变光子流

基于[M. Hawton, Phys. Rev. A 109, 062221 (2024)]中推导出的光子连续性方程的物理解释,对标准拉格朗日量进行二次量子化,从而得到单光子的洛伦兹和规范不变理论。标量势不被独立地二次量子化,因此所有模式具有正定范数。通过将物质源电流分离为描述无损耗传输线中传播的非吸收项以及局部化的单光子发射和检测项(这些项不需要横向和纵向模式的非局部分离),连续性方程得以推广。

量子物理
2025-04-01更新2025-03-16 发布

一种Benders割平面统治所有邻域调度问题

逻辑驱动的Benders分解(LBBD)及其分支-切割变体,即分支-检查方法,在广泛的优化问题中具有广泛的应用,包括调度问题。尽管LBBD能够提供针对特定问题的割平面以施加更紧的对偶界,但其在资源受限调度中的应用尚待深入探索。对于在不相关并行机上的基于位置的混合整数线性规划(MILP)调度模型,我们注意到某些$k-$OPT邻域可以通过常规局部搜索算子隐式探索,从而允许我们将局部分支集成到分支-检查方案中。通过枚举这些邻域并获得其局部最优解——从而证明它们为次优解——一个局部分支割平面(作为Benders割平面应用)可以一次性消除所有这些解,从而避免主问题中包含成千上万条Benders割平面导致的过载问题。然而,为了保证收敛到最优解,所构建的邻域必须被彻底探索,因此需要通过支配规则或选择性地仅在更可能减少最优性间隙的节点上加速这一耗时过程。本研究将这一思想局限于“内部(作业)交换”以构建特定形式的$4$-OPT邻域。尽管如此,实验结果表明,该方法在两个具有挑战性的调度问题上(即在具有序列依赖和资源约束设置的不相关机器上的总完工时间最小化和总延迟最小化问题)显著减少了最优性间隙或加快了向最优解的收敛速度。我们方法的简单性使其可以推广到其他邻域和不同的排序优化问题,为改进分支-检查方法提供了有前景的前景。

优化与控制
2025-04-01更新2023-10-09 发布

从解析性和幺正性进行EFT匹配

我们提出了一种新的物理量方法,用于将具有大质量态的紫外模型匹配到其无质量的有效场论(EFT)。我们利用复动量膨胀空间中的色散关系,用单一变量捕捉任意多重散射振幅的相关解析结构。因此,避免了多元复分析和 Crossing 考虑。令人惊讶的是,在维度正则化中不需要了解红外有效场论。所有的匹配信息都从紫外散射振幅的留数和不连续性中提取,幺正性分别以较低点和较低圈的结果表达。这种分解为更简单的构建块可以为从紫外场景类获得的有效场论结构提供新的见解,并促进更高圈阶计算。

高能物理-唯象学
高能物理-理论
2025-04-01更新2023-07-31 发布

在包含右手中微子的$\nu$SMEFT中的两圈重正化群方程

我们计算了标准模型有效场论(SMEFT)中包含右手中微子的理论,即所谓的$\nu$SMEFT中维度为五的算符的两圈重正化群方程(RGEs)。除了维度为五的算符的两圈RGEs外,我们还给出了可重正化耦合的RGEs,并包括了来自维度为五算符的贡献。我们检查了所有重正化常数在$\varepsilon \equiv (4-d)/2$的第一极点和第二极点之间的一致性关系,其中$d$是时空维度,发现对于轻子双态和右手中微子波函数重正化常数以及带电轻子和中微子Yukawa耦合矩阵的重正化常数,这些关系不成立。这导致这些场和Yukawa耦合矩阵的发散RG函数。我们指出,这种无穷大的RG函数来源于场和Yukawa耦合矩阵在场重新定义下的非不变性,考虑到味变换是一种线性的场重新定义。一旦恢复了重正化常数对冗余算符威尔逊系数导数的贡献,或者考虑了味不变量的RGEs(这是物理量且在场重新定义下保持不变),这些无穷大的RG函数将会消失。

高能物理-唯象学
高能物理-实验
2025-04-01 发布

Att-Adapter: 基于条件变分自编码器的鲁棒且精确的领域特定多属性文本到图像扩散适配器

文本到图像(T2I)扩散模型在生成高质量图像方面取得了显著成就。然而,仅通过文本指导,在新领域(例如数值型属性如眼睛开合度或汽车宽度)实现连续属性特别是多个属性的同时精确控制仍然是一个重大挑战。为了解决这一问题,我们提出了属性(Att)适配器,这是一种新颖的即插即用模块,旨在使预训练的扩散模型能够进行细粒度的多属性控制。我们的方法从一组样本图像(可以是未配对的并包含多种视觉属性)学习单一控制适配器。Att-Adapter 利用解耦交叉注意力模块,自然地将多个领域属性与文本条件相协调。我们进一步将条件变分自编码器(CVAE)引入 Att-Adapter,以减轻过拟合,匹配视觉世界的多样性。在两个公开数据集上的评估表明,Att-Adapter 在控制连续属性方面优于所有基于 LoRA 的基线方法。此外,我们的方法实现了更广泛的控制范围,并且在多个属性之间提高了解缠效果,超越了基于 StyleGAN 的技术。值得注意的是,Att-Adapter 非常灵活,在训练过程中不需要配对的合成数据,并且可以轻松扩展到单个模型中的多个属性。

计算机视觉与模式识别
人工智能
2025-04-01更新2025-03-15 发布

超图建模的一般相关性群组检测

群组检测作为一个具有多样应用的问题,传统上假设节点状态之间相互独立。然而,近期的研究聚焦于现实世界中的场景,这些场景往往涉及节点之间的相关性,挑战了现有模型中的简化假设。在本文中,我们考虑了一个全面的模型,用于描述节点状态之间的任意统计相关性。为了有效地捕捉并利用这些相关性,我们通过超图建模该问题,并受到[GLS22]的启发,同时在超边添加概率质量函数。利用这一模型,我们首先设计了一种新颖的贪心自适应算法,能够进行信息量大的测试并动态更新分布。性能分析提供了所需测试次数的上界,这些上界仅依赖于潜在概率分布的熵以及感染的平均数量。我们证明该算法在有相关性的群组检测设置中恢复或改进了所有已知结果。此外,我们给出了算法在顺序意义上最优的一些图族,并举例说明了算法或其分析不紧致的情况。随后,我们将提出的群组检测框架一般化到两个方向,即噪声群组检测和半非自适应群组检测。在两种情况下,我们都提供了关于所需测试次数的新理论界限。

信息论
信息论
2025-04-01更新2024-12-23 发布

视觉环境交互式规划在具身复杂问题回答中的应用

本文聚焦于具身复杂问题回答任务,即要求具身机器人理解具有复杂结构和抽象语义的人类问题。该任务的核心在于基于视觉环境感知制定适当的计划。现有方法通常采用一次性规划的方式,即一步到位规划,这种方法依赖于大型模型,且对环境的理解不足。为解决这一问题,本文提出了一种按顺序形式化计划的框架,并考虑了多步规划。为了确保框架能够处理复杂问题,我们构建了一个结构化的语义空间,在这个空间中,分层视觉感知和问题本质的链式表达可以实现迭代交互,从而使得顺序任务规划成为可能。在框架内,我们首先基于视觉层次场景图解析自然语言,以明确问题意图。然后,结合外部规则为当前步骤制定计划,弱化对大型模型的依赖。每个计划都基于视觉感知反馈生成,并通过多轮交互直至获得答案。此方法实现了持续反馈和调整,使机器人能够优化其行动策略。为验证我们的框架,我们贡献了一个包含更复杂问题的新数据集。实验结果表明,我们的方法在复杂任务中表现出色且稳定,并且在现实场景中的可行性也得到了验证,显示了其实用性。

机器人学
计算机视觉与模式识别
2025-04-01 发布

Fano三维流形上的完全例外丛及K3曲面上由球面扭转生成的群

对于存在长度为四的向量丛完全例外列的Fano三维流形,我们证明所有完全例外列均由移位向量丛组成。我们通过详细研究反典范除子上的球面扭转生成的群来证明这一点。例如,我们证明该群是自由的,并给出明确的生成元。

代数几何
14J45, 14J28, 18E30
2025-04-01更新2024-12-08 发布

独立数有界图中的哈密顿路径与哈密顿回路可在多项式时间内求解

图中的一条哈密顿路径(一个哈密顿回路)是指一条经过所有顶点的路径(一个闭合路径,分别对应)。判定输入图中是否存在哈密顿路径或哈密顿回路的问题是众所周知的NP完全问题,在NP完备理论发展初期就被证明为计算困难的经典问题之一。许多研究集中于特殊图类上的哈密顿路径和哈密顿回路问题的复杂性,但已知的肯定结果寥寥无几。即使对于独立数不超过3的$4K_1$-free图,这两个问题的复杂性仍然是开放的。我们在独立数有界的图的一般框架下回答了这个问题。我们还考虑了一个新引入的问题称为“哈密顿-$\ell$-链式连接”,它与图中的路径覆盖和连通性概念相关。该问题询问在输入图中给定的$\ell$对顶点是否可以通过不相交的路径连接起来,并且这些路径共同遍历图的所有顶点。当$\ell=1$时,哈密顿-1-链式连接问题即为寻找给定一对顶点之间的哈密顿路径问题。我们的主要结果表明,对于任意整数$k$和$\ell$,当图的独立数不超过$k$时,哈密顿-$\ell$-链式连接问题是可以在多项式时间内求解的。

离散数学
组合学
2025-04-01更新2023-09-17 发布

关于Ramanujan的$\tau$函数的Lehmer猜想的证明

de La Harpe、Pache和Venkov在2005年左右通过$E_8$格壳层中的球形设计推导出了Lehmer猜想的一个判据。我们通过结合球形设计、调和多项式、加权theta级数以及Deligne关于$\tau$函数模数的界来验证此判据成立。

数论
2025-04-01更新2025-03-30 发布

共 13511 条搜索结果

共 13511 条