分类
CFIRE:结合局部解释的通用方法
我们提出了一种新的可解释人工智能(XAI)算法,通过将XAI方法与闭合频繁项集挖掘相结合,从表格数据的局部解释中计算出忠实、易于理解且完整的全局决策规则。我们的方法可以与任何能够指示给定样本在特定黑盒决策下哪些维度重要的局部解释器配合使用。这一特性使得我们的算法能够在不同的局部解释器之间进行选择,解决分歧问题,即观察到没有单一的解释方法在模型和数据集上始终优于其他方法的现象。与通常的实验方法不同,我们的评估还考虑了模型可解释性的拉什蒙效应。为此,我们在14个基准数据集上考虑的700个黑盒模型中展示了我们方法的稳健性,几乎为所有模型找到了合适的规则。结果还表明,我们的方法在生成紧凑且完整的规则时表现出更好的运行时间、高精度和F1分数。
布朗量子混沌中普适频谱关联的分层解析方法
我们发展了一种分析方法,用于零维布朗模型中量子混沌的频谱形式因子和非时序关联函数。该方法将这些频谱关联表达为一个封闭微分方程组的一部分,此方程组可以适用于所有系统尺寸以及三种标准对称类(由时间反演对称性的存在及其性质决定,分别为酉对称类、正交对称类和辛对称类)。该方程组精确适用,并以相同的形式适用于戴森的布朗运动以及所有具有随机涌现基不变性的系统,其中模型相关的信信息被归纳到单一的动力学时间尺度中,我们还确立了其显式形式。我们进一步通过数值验证了布朗 Sachdev-Ye-Kitaev 模型中的这种普适性,发现其与确定费米子数的对称类的解析预测完全一致。这为我们提供了此类模型频谱关联的完整解析描述,并使我们能够识别在大类模型中哪些关联是普适的。
各向异性超导体/反铁磁体/各向异性超导体约瑟夫森结中的无外场约瑟夫森二极管效应
反铁磁体(AM)是一类奇异的反铁磁材料,即使在净全局磁化为零且自旋轨道耦合(SOC)效应缺失的情况下,也会表现出自旋分裂现象。本文理论研究了各向异性超导体/反铁磁体/各向异性超导体(ISC/AM/ISC)约瑟夫森结中的超电流非互易性,揭示了不对称的约瑟夫森临界电流、0-π转变以及异常的电流-相位关系(CPR)。即使在没有自旋轨道耦合的情况下,由于反铁磁体强度和取向的综合作用,传统超导体中观察到了显著的约瑟夫森二极管效率(JDE)。然而,在内禀自旋轨道耦合(ISOC)存在时,这种效应显著增强,导致单带和双带ISC/AM约瑟夫森结中均出现了明显的二极管效应。此外,研究发现,无论在哪种情况下,JDE在较高反铁磁体强度和中间取向时更为显著,而在0°和45°取向时明显减弱。我们的结果还表明,势垒透明度和反铁磁体长度对优化JDE起着至关重要的作用。在单带ISC/AM系统中,JDE对于任何反铁磁体长度都持续存在,而在双带ISC/AM系统中,较长的反铁磁体结会导致JDE减弱。此外,我们的研究结果表明,在考虑强反铁磁体强度的情况下,无论是单带还是双带ISC/AM约瑟夫森结,都可以实现约52%的二极管效率。值得注意的是,单带ISC提供了更宽的反铁磁体取向范围,这有助于更好地调节和优化JDE。我们的研究结果揭示了反铁磁体强度、取向和内禀自旋轨道耦合对JDE效率的影响,为超导二极管的设计提供了重要见解。
Gilbert阻尼磁系统中热激活的稳健理论
磁系统可能会表现出受热激发的跃迁,其时间尺度通常由阿伦尼乌斯定律描述。然而,对于某些情况之外,这种时间尺度的稳健预测仅在特定情况下可用。受到Langer谐波理论的启发,我们推导出多维自旋系统的通用激活速率。假设初始极小值处的局部热平衡,并在鞍点处推导概率密度沿实际不稳定动力学模式的流表达式,我们得到了一个依赖于Gilbert阻尼参数$\alpha$的激活速率表达式。我们发现,该表达式在物理相关的$\alpha\ll1$范围内仍然有效。当激活表现为所有自旋的相干重取向时,通过用自旋波频率表示阿伦尼乌斯定律的前因子,我们获得了有限反铁磁自旋链情况下的表达式,该表达式依赖于系统大小的平方指数增长,表明Meyer-Neldel规则失效。
NEOWISE数据处理及近地小行星观测的颜色校正
广域红外巡天探测器(WISE)及其后续任务NEOWISE是近地小行星(NEAs)热数据的关键来源。这些任务利用地球轨道上的空间平台,分别在四个不同的波长带W1-W4下获取了有效波长为3.4、4.6、12和22微米的热图像。尽管该任务被用于近地小行星观测,但其架构最初是为观测恒星设计的。因此,在处理近地小行星数据时,需要仔细分析数据以考虑这些目标之间的差异。然而,对于不熟悉该任务的用户来说,详细的数据处理信息可能难以获得。虽然相关信息有详细的记录,但找到它们可能会很困难,并且许多细节(如颜色校正的具体内容)并未完全解释。因此,在这项工作中,我们总结了使用NEOWISE数据的经验教训,概述了如何检索和处理NEOWISE数据进行近地小行星研究的基本方法,并提出了一个经验性的颜色校正确定方法。我们通过处理三个近地小行星的数据强调了这一过程的重要性,发现几乎一半的可用观测数据应被丢弃。最后,我们基于不同级别的数据分析呈现了简单的热模型结果,以突出数据处理对模型结果的影响。
关于带3个右手中微子的I型Seesaw模型在对撞机可检验性的问题
如果在基于加速器的实验中发现任何重的中性轻子,一些关键问题将涉及它们可能与中微子质量或轻子产生之间的联系。在标准模型的一个可重正化扩展中加入三个右手中微子,我们探讨了通过测量这些重的中性轻子衰变到单个SM代的分支比能获得关于基本模型参数的多少信息。我们发现,如果这些分支比能够被任意精度地测量,并假设动力学上可区分的右手中微子,那么结合轻中微子振荡数据,这些信息足以确定模型中的所有18个参数。当考虑到统计不确定性时,类似于未来电子对撞机如FCC-ee或CEPC在几十GeV的质量范围内的实现情况,某些参数退化现象仍然存在,但测量结果仍可以为模型提供有力的一致性检验。在亚GeV范围内,SHiP实验可以很好地敏感到单个模型参数,DUNE也可能如此。这表明这些实验不仅有望发现重的中性轻子,而且在理解其在粒子物理和宇宙学中的作用方面也具有重要意义。
针对最佳超新星选择的多模态婴儿基础指标
我们对22个核心坍缩超新星(SNe)进行了比较研究,这些超新星被选中以探索一种新颖的多维排名方案,旨在识别最佳超新星。每个超新星根据三个主要标准进行评估:(1)从光曲线建模和光谱指示器推断出的爆炸能量;(2)通过生成视觉模型(Midjourney v5)将超新星宿主星系转化为人脸后分配的美学评分;以及(3)由Claud.IA(一名6个月大的婴儿,经过多次接触精心策划的超新星图像训练,以选择最佳超新星)。我们定义并标准化了所有标准,以确保样本中的统计一致性,并特别关注婴儿基础分类模型固有的偏见。排名前五的超新星表现出高爆炸能量(E > 1e51 erg)和极冷的宿主星系(转化后),Claud.IA明显倾向于具有对称面部形态和突出螺旋臂的星系。最终应用Claud.IA确定我们样本中最佳的超新星为SN 2022joj。我们的研究表明,将人机混合美学判断和早期发育认知纳入天体物理分类是可行的,并引发了关于宇宙爆炸“最佳”本质的有趣问题。鼓励进一步跟进。
鲁棒线性优化问题的求解
鲁棒优化(RO)是处理具有不确定性的优化问题的重要工具。鲁棒优化的主要目标是解决由于约束条件中的不确定性导致的问题,这些不确定性需要满足给定不确定集内所有可能实现的情况。鲁棒优化的挑战在于将约束条件进行重新表述,从而将不确定的优化问题转化为可处理的确定形式。本文重点研究了鲁棒优化问题的鲁棒对应(RC),并针对仅约束条件与不确定性相关的鲁棒线性优化问题,建立了一种数学模型以提出解决方案策略。文中考虑了箱式和椭球式不确定性集,并在每种对应的案例中通过一些说明性的数值例子验证了所提出的求解方法。
镜像轴子孤子的演化
我们研究了一种弱相互作用于背景物质和磁场的轴子孤子。对于由二次磁螺旋不变量引起的磁流的镜像对称孤子,其描述符为Iroshnikov-Kreichnan谱。在大尺度磁场下未观察到发电机效应。在镜像轴子孤子中,可能产生一种导致磁螺旋流的相变。通过这种转变,孤子变为镜像不对称。当镜像对称被打破时,轴子孤子允许磁能的产生,这是轴子能量转化的结果。主要结果表明,在过程的初始阶段,我们计算出一个尺度,在此尺度上大尺度磁场的生成最为强烈。通过数值模拟,我们发现磁场的较低横向谐波的振幅大于较高谐波。构建了一个最简单的统计系综,定义为将所有谐波投影到主谐波上。我们提出了一种假设,即这可能是轴子MHD中某种不稳定性的一个标志。现在,我们可以提供这一特征的一种可能解释。当轴子孤子的镜像对称被打破时,轴子平均场方程中的γ项与主谐波相互作用,结果轴子孤子获得磁能并变为螺旋状。
戈伦斯坦加权射影空间的形变与扩张
本文研究了所有14个三维戈伦斯坦加权射影空间$\mathbf{P}$的形变存在性问题,通过计算其一般反典范除子可扩展的次数来实现。在有利情况下(14个中有8个),我们发现$\mathbf{P}$可以形变为一个三维非原始极化$K3$曲面的一般扩展。在此过程中,我们证明了每个这样的$\mathbf{P}$在其反典范模型中满足性质$N_2$,并计算了$\mathbf{P}$上的锥体的形变空间。这还间接给出了$\mathbf{P}$可扩展的具体次数。
一策应对一切:多形态运动的端到端学习方法
深度强化学习技术在稳健的腿式运动方面取得了最先进的成果。尽管存在四足机器人、人形机器人和六足机器人等多种腿式平台,但该领域仍缺乏一个单一的学习框架,能够轻松且有效地控制这些不同的形态,并可能实现对未见过的机器人形态的零样本或少量样本迁移。我们引入了统一机器人形态架构(URMA),以填补这一空白。我们的框架将端到端的多任务强化学习方法引入腿式机器人领域,使学到的策略能够控制任何类型的机器人形态。我们方法的关键思想是允许网络学习一个抽象的运动控制器,由于我们的形态无关编码器和解码器,该控制器可以在形态之间无缝共享。这种灵活的架构可以被视为构建腿式机器人运动基础模型的第一步。我们的实验表明,URMA能够在多种形态上学习运动策略,并能轻松迁移到模拟和现实世界中的未见过的机器人平台。
康德拉季耶夫经济周期的硬科学方法
为比经济学家更科学地证明康德拉季耶夫周期,研究了物理变量而非货币指标。在此重新绘制并更新了之前发表的图表,并使用了最新数据。能源消耗显示出一个56年的周期性规律变化。银行倒闭、凶杀案、飓风、女权主义以及太阳黑子活动等十余种人类活动/现象被证明与此周期共振。这一现象可能的解释与气候变化或个人对环境的主动影响时间有关。有证据表明,近年来该周期的幅度和持续时间可能在缩短。这些观察所涉及的所有定量置信水平在科学标准下都很低,这使批评者质疑该现象的存在性。
Light-R1:从零开始及超越的长链推理COT课程训练、DPO与强化学习方法
本文介绍了Light-R1,这是一个开源套件,用于通过可重复且成本效益高的方法训练长推理模型。鉴于DeepSeek-R1系列所使用的数据具有专有性质,我们开发了一种仅依赖公共数据和模型的替代方法。我们的课程训练逐步增加数据难度,并结合多阶段后训练。我们的Light-R1-32B模型基于Qwen2.5-32B-Instruct训练,其在数学推理方面优于DeepSeek-R1-Distill-Qwen-32B。实验结果表明,当不同训练阶段有独特且多样化的数据集可用时,这种课程方法变得更加有效:使用来自我们课程数据集的3,000个挑战性示例对DeepSeek-R1-Distilled模型(由DeepSeek团队在其专有数据上预调优)进行微调,产生了最先进的7B和14B模型,而32B模型Light-R1-32B-DS的表现与QwQ-32B和DeepSeek-R1相当。此外,我们将工作扩展到对长推理模型应用GRPO。我们的最终Light-R1-14B-DS在数学领域取得了14B模型中的最佳性能,AIME24和AIME25得分分别为74.0和60.2,超过了多个32B模型和DeepSeek-R1-Distill-Llama-70B。尽管主要专注于数学训练,Light-R1-14B-DS在跨领域泛化方面也表现出色。Light-R1代表了在使复杂推理模型更易于实际应用方面的重要进展。我们的模型、训练数据和代码已发布在https://github.com/Qihoo360/Light-R1。
非项目页面对顺序下一项目预测影响的建模与分析
顺序推荐模型通过对用户与项目之间交互序列的分析,能够学习用户意图并预测下一个项目。除了项目交互外,大多数系统还存在与我们所说的非项目页面的交互:这些页面与特定项目无关,但仍可以提供有关用户兴趣的见解,例如导航页面。因此,我们提出了一种通用方法,将这些非项目页面纳入顺序推荐模型以增强下一项目预测。首先,我们利用假设检验框架HypTrails证明非项目页面对后续交互的影响,并提出在顺序推荐模型中表示非项目页面的方法。随后,我们调整流行的顺序推荐模型以整合非项目页面,并研究其在不同项目表示策略下的性能以及处理噪声数据的能力。为了展示模型在整合非项目页面方面的通用能力,我们在受控条件下创建了一个合成数据集,并在两个现实世界的数据集上评估了包含非项目页面所带来的改进。我们的结果显示,非项目页面是一个有价值的信息来源,将其纳入顺序推荐模型可提高所有分析模型架构的下一项目预测性能。
大型语言模型在翻译中的迷失:M-ALERT揭示跨语言安全漏洞
在多种语言中构建安全的大型语言模型(LLMs)对于确保安全访问和语言多样性至关重要。为此,我们引入了M-ALERT,这是一个多语言基准,用于评估五种语言(英语、法语、德语、意大利语和西班牙语)中LLMs的安全性。M-ALERT每种语言包含15,000个高质量提示,总计75,000个提示,遵循详细的ALERT分类法。我们在10种最先进的LLMs上的广泛实验突显了语言特定安全性分析的重要性,揭示了模型在不同语言和类别之间经常表现出显著的一致性不足。例如,Llama3.2在意大利语的犯罪税收类别中显示出高风险,但在其他语言中保持安全。类似差异在所有模型中都可以观察到。相比之下,某些类别,如毒品大麻和犯罪宣传,始终在各种模型和语言中触发不安全响应。这些发现强调了在LLMs中采用稳健的多语言安全实践的必要性,以确保在多样化用户社区中的安全和负责任使用。
五维亏格中的Tannakian Schottky猜想
使用Tannakian形式主义,可以为一个主要极化的阿贝尔簇赋予一个重ductive群以及其表示。我们证明了该群与表示在亏格不超过5的情况下能够唯一确定雅可比簇。更一般地,我们的结果在所有亏格下的双椭圆Prym簇流形上成立。这为Weissauer和Kr\"amer最近提出的猜想提供了首个证据。我们在证明中使用的主要工具是基于Chern-Mather类的雅可比簇检测准则。
张量对称性与光晶格热化
本文系统地研究了具有最近邻耦合的立方非线性晶格热化与其因非线性而产生的混合张量结构之间的可能联系。通过将晶格系统的底层重新表述为描述模式振幅(或投影系数)动力学的非线性演化方程,其中线性耦合变为可对角化的形式,而所有的三阶非线性项转化为由四阶混合张量加权的三个模式振幅乘积的组合求和。我们已经确定了几种混合张量的确切结构(对应于不同类型的三阶非线性),并将其对称性质(准厄米性和与两个晶格守恒律相关的排列对称性)与热化或缺乏热化联系起来。此外,通过直接数值模拟观察到,保持这些张量对称性的晶格在热平衡时模式占据数趋于瑞利-金斯分布。另外,我们还提供了一些例子,表明破坏张量对称性的三阶晶格最终不会达到瑞利-金斯分布。最后,提出了一种研究三阶非线性晶格热化的逆向方法,建立了局域基和模态基晶格之间的对偶性质。这一思想在于在局域基中的非线性类型与其超模基中的相应相互作用之间建立一种权衡关系。借助此方法,我们能够识别一大类嵌入模态空间的非线性晶格,并找到其简单形式,从而更深入地探讨超模局域化(或去局域化)在热化过程中的作用。
关于群的共轭类图中的禁用子图
设$G$为有限群。"交换/幂零/可解共轭类图" ($\Gamma_{CCC}(G)$, $\Gamma_{NCC}(G)$ 或 $\Gamma_{SCC}(G)$) 是一个简单图,其顶点集由$G$的所有非中心共轭类组成。两个顶点$x^G$和$y^G$相邻当且仅当存在元素$a \in x^G$和$b \in y^G$,使得$\langle a, b \rangle$分别构成$G$的一个交换、幂零或可解子群。\par 本文主要研究在$\Gamma_{CCC}(G)$/$\Gamma_{NCC}(G)$/$\Gamma_{SCC}(G)$中基于禁用诱导子图的cographs(无$P_4$)、弦图(无$C_n$,$\forall n\geq 4$)、分裂图(不含同构于$C_4$、$C_5$和$2K_2$的诱导子图)、阈值图(不含同构于$P_4$、$C_4$、$C_5$和$2K_2$的诱导子图)以及爪形图(不含具有三个两两不相邻邻居的顶点)。\par 我们对EPPO群、阶数为$pq$的群以及幂零群提供了这些性质的完整分类。此外,我们刻画了对称群和交错群的交换共轭类图的诱导子图。对于如二面体群、双循环群和广义二面体群这样的可解群,我们得到了完整的结果。此外,我们完全刻画了Mathieu群$M_{11}$、$M_{12}$和$M_{22}$以及某些极小单群(如Suzuki群和$\mathrm{PSL}(3,3)$)的图。对于其他极小单群,如$\mathrm{PSL}(2,2^p)$、$\mathrm{PSL}(2,3^p)$和$\mathrm{PSL}(2,p)$(其中$p > 3$且$5 \mid p^2 + 1$),我们证明了可解共轭类图始终是一个cograph。最后,我们提出了几个开放问题,指出了该领域进一步研究的方向。
基于Si/Si-Ge异质结构的单电子量子点工业化制备
本文报道了基于异质结构自旋量子比特器件与工业CMOS技术的兼容性。研究展示了利用英飞凌200毫米生产线在有限热预算下制造的Si/Si-Ge量子点器件,这些器件表现出最先进的电荷感应、电荷噪声及谷分裂特性,证明了工业化制备并未损害异质结构的质量。这些测量参数均与自旋量子比特相干性和量子比特门保真度相关联。我们描述了单电子器件布局、设计及其采用电子束光刻的制备工艺,并介绍了标准的90纳米后端布线流程,该流程可扩展至多层布线以实现可扩展的量子计算架构。此外,我们还展示了毫开尔文级别的表征结果。我们的工作展示了尽管受到热预算限制,工业化制备方法仍能充分利用Si/Si-Ge材料系统的固有CMOS兼容性,为具有高产量和高质量的先进量子处理器架构铺平了道路。
横向轨道角动量:正本清源
时空涡旋脉冲所关联的横向轨道角动量(tOAM)的本质近期成为争论焦点。我们证明了近期几篇论文中提出的tOAM方法存在错误,并导致了不合理的物理结果,包括错误地声称总tOAM为零。我们强调在计算任何扩展物理对象的轨道角动量时,必须基于同一时刻的时间,同时重申质心作为所有轨道角动量计算参考点的特殊地位。[Phys. Rev. Lett. 127, 193901 (2021)]中提出的理论是唯一正确的基于经典场的框架,既与实验一致,又提供了时空光场中横向轨道角动量的自洽理解。
共 13511 条搜索结果
共 13511 条