Research

arXiv

分类

实现容错通用量子计算的一个潜在途径是利用非阿贝尔拓扑码。在这项工作中，我们研究了如何通过量子双模型$\mathcal{D}(S_3)$——一种特定的非阿贝尔拓扑码来实现这一目标。通过将每个现场希尔伯特空间嵌入到一个量子比特-量子三重态对中，我们给出了创建、移动以及局部测量所有非平凡任意子的电路的明确构造方法。我们还设计了一种专门的任意子干涉仪，用于远程测量分离良好的任意子的总电荷；这种方法避免了融合，从而保持了容错性。这些协议使得实现Cui等人提出的通用门集成为可能，并在计算过程中对电路级噪声进行主动量子误差校正。为了进一步降低错误率并便于误差校正，我们将$\mathcal{D}(S_3)$的每个物理自由度编码进一种新型的量子纠错码中，从而在逻辑层面上实现了任意子操作电路中所有门的容错实现。我们的提议为在NISQ（含噪声中等规模量子）时代实现稳健的通用拓扑量子计算提供了一条有前景的路径。

量子物理

强关联电子体系

2025-03-24更新2024-11-14 发布

在钙钛矿晶格排列的材料中，由于理论上这些晶格上的轨道可以形成平带，因此重新引起了人们的兴趣。然而，实际材料往往不遵循理论模型，这就是为什么表现出平带物理特性的钙钛矿材料很少见的原因。本文研究了理想“钙钛矿能带”在实际材料中存在所需的条件，并探讨如何使这些能带接近费米能级。我们发现，文献中常用的简单模型并不适用于实际钙钛矿材料中费米能级附近的能带。但令人惊讶的是，某些包含氧轨道位于钙钛矿四面体内部的氧化物化合物确实显示出接近理想的钙钛矿平带特性。我们通过包含氧轨道的广义紧束缚模型解释了这一观察结果。此外，我们根据已知钙钛矿材料的晶体结构、能带结构和化学特性对其进行分类，并提出了未来实验中应研究的材料。

材料科学

强关联电子体系

2025-03-24 发布

慢性下腰痛（cLBP）是一种普遍存在的疾病，对功能和生活质量有深远影响。尽管存在多种基于证据的治疗方法，但它们的平均治疗效果都较为有限，这可能与个体间治疗反应的差异以及cLBP多样化的病因有关。这项多中心序贯、多次分配随机对照试验（SMART）研究了四种治疗模式，并通过两阶段随机化设计，旨在招募630名完成试验方案的受试者。主要目标是通过估计患者特征和初始治疗反应下的最优治疗或治疗组合，开发精准医学方法。分析策略集中于估计可解释的动态治疗方案，并识别对特定干预措施最敏感的亚组。为了增强通用性和招募规模，实施了广泛的纳入标准，特别是即使受试者无法被分配到其中一项（但不超过一项）研究干预措施时，也可以符合条件参与试验。在限制受试者可接受治疗的情况下进行招募，需要对标准的最小化方法进行修改以平衡协变量。BEST试验代表了迄今为止专注于临床决策的最大型SMART之一，也是针对cLBP最大的试验。通过收集大量的生物标志物和表型数据，该试验可能揭示潜在的治疗机制，并为临床实践中个性化治疗cLBP建立更基于证据的方法。

应用

2025-03-24 发布

LHCb合作组在运行3期间继续大量利用运行1和运行2的遗留数据集。随着操作重点从遗留数据转向实时运行3样本，确保分析师能够继续从遗留数据集中受益的可持续且高效的系统至关重要。LHCb剥离项目是面向用户的离线数据处理阶段，它通过可由Python配置的架构允许分析师仅需选择感兴趣的物理候选对象。在完成并验证物理选择后，整个遗留数据集将在称为剥离活动的小时间窗口内重新处理。LHCb的剥离活动以较短的开发窗口为特点，其中大量合作者（通常是初级研究人员）直接开发各种物理选择；最近的一次活动涉及超过900个物理选择。现代组织工具，如GitLab里程碑，被用于跟踪所有开发工作，并确保物理工作组的所有开发者都遵守严格的计划。此外，GitLab中还实施了持续集成，用于运行物理选择的功能测试，监控不同算法的监测率和运行时间，以确保操作一致性。除了这些大型活动外，该项目还进行夜间构建，以确保软件在其他地方进行并行开发时的可维护性。

高能物理-实验

2025-03-24 发布

数据并行性、张量并行性和管道并行性等各种并行性以及激活检查点、冗余消除和卸载等内存优化方法被提出以加速大规模语言模型的分布式训练。为了找到这些技术的最佳组合，提出了自动分布式训练系统。然而，由于缺乏重叠意识、无法探索庞大的搜索空间以及忽略微批次之间的不平衡，现有系统仅调整优化的一个子集，导致性能次优。为了解决这些不足，我们提出了Mist，这是一种内存、重叠和不平衡感知的自动分布式训练系统，全面协同优化所有内存占用减少技术与并行性。Mist基于三个关键思想：（1）细粒度重叠为中心的调度，以重叠方式协调优化；（2）基于符号的性能分析，利用符号表达式预测运行时和内存使用情况以实现快速调优；（3）不平衡感知的分层调优，将过程分解为跨阶段不平衡和重叠感知的混合整数线性规划问题以及单个阶段的双目标约束优化问题，并通过帕累托前沿采样连接它们。我们的评估结果显示，与最先进的手动系统Megatron-LM和最先进的自动系统Aceso相比，Mist分别实现了平均1.28倍（最高1.73倍）和1.27倍（最高2.04倍）的速度提升。

分布式、并行与集群计算

人工智能

2025-03-24 发布

本文提出了一种先进的符号回归（SR）系统QDSR，该系统集成了遗传编程（GP）、质量-多样性（QD）算法以及量纲分析（DA）引擎。我们的方法专注于从数据集中精确恢复已知表达式，特别关注Feynman-AI基准测试。在广泛使用的包含117个物理方程的数据集中，QDSR实现了91.6%的精确恢复率，比所有先前的SR方法高出超过20个百分点。我们的方法对噪声也表现出较强的鲁棒性。除了QD和DA之外，如此高的成功率还源于词汇表达能力和搜索空间大小之间的有利权衡：我们证明，通过预先计算有意义的变量（例如无量纲组合和精心选择的标量积）显著扩展词汇表通常可以简化方程复杂度，从而带来更好的性能。消融研究还将表明，仅使用QD就已优于最先进的方法。这表明，简单地通过将个体投影到QD网格上来集成QD，就可以显著提升现有算法的性能，而无需进行重大系统改造。

从尘埃盘持续存在数百万年到化学分异的建立，尘埃陷阱被认为在塑造原行星盘和早期行星形成过程中发挥关键作用。然而，通过结构化盘内的间隙和空腔中检测到气体和尘埃表明这些陷阱可能并不完美。我们利用二维（2D）和三维（3D）双流体大尺度流体动力学模拟，直接计算了气流扰动下由不同质量的嵌入行星引起的盘气动力学，并研究其对尘埃颗粒的动力学影响。无论是2D还是3D，我们都发现对于较低质量的行星以及较高的湍流参数$\alpha$，尘埃陷阱更具泄漏性。更重要的是，在其他条件相同的情况下，我们发现3D中被压力峰捕获的尘埃质量比例比2D中减少了多达一个量级。我们的模拟显示了尘埃径向运动的复杂行为，该行为在方位角和极角方向上均不均匀，即使在相对较高的St = 0.1情况下，整体动力学仍主要受尘埃与气流耦合的控制。我们发现的泄漏陷阱表明，砾石隔离质量可能并非真正隔离，且开槽行星并未形成无条件的不可渗透屏障。我们的研究结果对近期JWST MINDS的结果具有重要启示，该结果显示挥发物（包括水）存在于带有外侧尘埃环的盘内区域。

地球与行星天体物理学

2025-03-24 发布

递归Cartan分解（CDs）提供了一种精确分解量子电路为更小部件的方法，使其成为酉合成的核心工具。本文详细概述了递归CDs，阐明其数学结构，展示其算法效用，并在大规模下进行数值实现。我们调整、扩展并统一了现有的递归CDs数学框架，从而获得新见解并简化新的电路分解构造。基于此，我们证明文献中几种领先的合成技术——量子Shannon分解、Block-ZXZ分解和Khaneja-Glaser分解——实现了相同的递归CD。我们还基于正交群和辛群提出了新的递归CD，并推导出参数最优的分解。此外，我们将文献中的CDs数值工具汇总在一个共同背景下，并完善它们以允许经典CDs的所有可能形式以规范形式进行数值实现。作为一个应用，我们高效地将快进哈密顿量时间演化编译为固定深度电路，在一台笔记本电脑上仅用22秒就将包含10³个量子比特的横向场XY模型编译为2×10⁶个门。

量子物理

2025-03-24 发布

在太阳系的行星体上，撞击是最普遍存在的过程。在这些撞击事件中，冲击波可以沉积足够的能量，导致目标物质发生冲击变暗现象，进而改变其光谱特性。这种光谱变化可能导致小行星的分类出现歧义，并造成陨石类似物识别错误。本研究调查了冲击变暗对普通球粒陨石以及Howardite-Eucrite-Diogenite族陨石可见光和近红外光谱的影响。结果显示，随着冲击变暗程度增加，所有样品的反照率均降低且吸收带被抑制。我们发现，在未改变样本中加入≥50%的冲击变暗物质即可使普通球粒陨石从S-族分类变为C-族或X-族；同样比例的添加量足以使斜长岩从V型变为O型，而由100%冲击变暗物质组成的斜长岩则被归类为Q型。我们讨论了仅凭反照率进行小行星分类的局限性，这对未来的基于空间的红外巡天具有重要意义。此外，我们还探讨了冲击变暗是否会导致对具有H和L球粒陨石成分的近地小行星（NEOs）发现存在偏见，这可能解释了NEOs中LL球粒陨石丰度较高的原因。

地球与行星天体物理学

2025-03-24 发布

非模态分割旨在为物体的可见区域和被遮挡区域预测分割掩码。现有大多数方法将此问题形式化为有监督学习问题，需要人工标注的非模态掩码或合成训练数据。因此，其性能依赖于数据集的质量，而这些数据集往往缺乏多样性和规模。本文提出了一种免调参的方法，通过重新利用预训练的基于扩散的修复模型实现非模态分割。我们的方法受到修复模型的“无遮挡偏置”，即修复后的物体倾向于呈现完整的无遮挡物体。具体而言，我们通过修复重建物体的被遮挡区域，然后进行分割，整个过程无需额外的训练或微调。在五个数据集上的实验表明了该方法的泛化能力和鲁棒性。平均而言，我们的方法比最先进的方法准确率高出5.3%。

计算机视觉与模式识别

2025-03-24 发布

近年来，大型视频语言模型（LVLMs）在多模态理解方面取得了显著进展，然而如何对其视频语境中的事实性进行有效评估仍是一个亟待解决的关键挑战。为填补这一空白，我们提出了Video SimpleQA，这是首个专门用于评估LVLMs事实性的综合基准。我们的工作通过以下几个关键特征区别于现有的视频基准：1）所需知识：要求整合超越显式叙述的外部知识；2）事实导向问题：针对客观、无争议的事件或关系，避免主观解读；3）明确且简短的答案：答案以简洁且无歧义的方式呈现，能够通过LLM-as-a-judge框架实现自动化评估，并尽量减少评分方差；4）外部来源验证：所有标注均经过与权威外部参考的严格验证，确保可靠性；5）时间推理需求：标注的问题类型涵盖静态单帧理解和动态时间推理，明确评估LVLMs在长上下文依赖下的事实性。我们对41个最先进的LVLMs进行了广泛评估，并总结了以下主要发现：1）当前LVLMs在事实遵守方面存在明显不足，尤其是开源模型表现更差，性能最佳的Gemini-1.5-Pro模型仅达到54.4%的F分数；2）测试时计算范式显示出微不足道的性能提升，揭示了通过后处理计算增强事实性的根本局限性；3）检索增强生成方法在提高性能的同时带来了额外的推理时间开销，呈现出重要的效率-性能权衡。

计算机视觉与模式识别

2025-03-24 发布

广义相对论（GR）的框架近期通过引入Cotton引力（CG）得到了扩展，这是由J. Harada提出的理论延伸。这种修改方法将Cotton张量引入引力场方程，自然包含了所有的传统GR解，同时使宇宙常数作为一个积分常数出现。在本研究中，我们深入探讨了当CG与非线性电动力学（NLED）耦合时的含义，构建并分析了三个不同的静态、球对称构型。我们的研究重点在于每个模型的视界结构、度规特性以及潜在的NLED拉格朗日密度。我们还通过将这些解计算出的阴影半径与事件视界望远镜（EHT）对Sgr A*观测结果的约束进行比较，将理论预测与观测数据进行对比。结果揭示了一组广泛的时空几何结构，从多重视界结构到裸奇点不一而足。此外，预测的阴影大小与EHT观测结果的一致性进一步证实了这些模型在某些参数范围内描述Sgr A*天体物理图像的可行性。

设 $M(A, I)$ 是带有对合的自由部分可换幺半群，而 $G(A, I)$ 是其商群，例如右角Artin群或Coxeter群。对于在 $M(A, I)$ 上具有可识别约束且输入规模为 $n$ 的词方程组，我们得到了解集的一个结构性结果：该方程组在 $M(A, I)$ 或群 $G(A, I)$ 中的所有解构成一个EDT0L语言。即，可以通过某个扩展幺半群上的同态由一个NFA $\mathcal{A}$ 描述。此外，$\mathcal{A}$ 可以通过一个NSPACE($n \log n$)-变换器有效构造。这表明可满足性问题（“该方程组是否有解？”）和有限性问题（“解是否无限多？”）可以在NSPACE($n \log n$) 内解决。在统一版本中，这些问题均为PSPACE完全问题，但对于适当约束类，我们有更精确的复杂度，并推测上述决策问题在此设定下为NP完全问题。我们的结果同样适用于经典情况下自由幺半群中的词方程，其中对合为从右到左读取单词。这允许我们限定解必须为回文。

形式语言与自动机理论

计算机科学中的逻辑

群论

03D05, 20F65, 20F70, 68Q25, 68Q45

F.2.2; F.4.2; F.4.3

2025-03-24更新2016-03-09 发布

几乎完全非线性（APN）函数的两个重要问题是枚举问题与等价性问题。本文通过引入一种针对此类函数的强大群论方法，解决了双投影APN函数族中的这两个问题。已知偶数维上的大部分APN函数族都属于双投影APN函数族。利用我们的方法，我们解决了所有已知的双投影APN函数的等价性问题，并进一步给出了一类新的双投影APN函数。通过我们的方法，我们计算了所有已知双投影APN函数族中不等价APN函数的数量，并证明本文所发现的新函数族给出了指数级数量的新不等价APN函数。最近，Taniguchi APN函数族被Kaspers和Zhou（《密码学杂志》34卷第1期，2021年）证明包含指数级数量的不等价APN函数，这一结果改进了他们之前对于Zhou-Pott函数族的计数（《组合论A辑》186卷，2022年）。我们的群论方法大大简化了证明这些结果所需的工作量，并为双投影APN函数大类中的每一个函数族提供了一种通用自然的方法，其中包含了上述两个函数族以及许多其他函数族。

组合学

信息论

2025-03-24更新2021-11-07 发布

本文研究了AltGDmin算法在求解噪声低秩列感知（LRCS）问题中的应用。我们的样本复杂度保证较现有最佳结果提高了$\max(r, \log(1/\epsilon))/r$倍，其中$r$为未知矩阵的秩，$\epsilon$为最终所需的精度。本文的第二个贡献是对所有研究与LRCS相同数学问题但使用不同名称的工作进行了详细比较。

信号处理

机器学习

2025-03-24更新2024-09-12 发布

测量对量子系统有深远影响，并可用于创建非平衡条件下的新型物质状态。我们研究了涉及幺正演化和测量的混合量子电路中出现的多体纠缠结构。我们描述了在测量和幺正演化之间达到平衡时，多体纠缠如何扩展到远大于未被监测系统的距离，从而避免了通常的纠缠命运。我们引入了一种基于生成树图的图形表示方法，可以推断出一般子区域的真多体纠缠演化。我们在实现一维测量诱导动态相变的混合随机Haar电路中举例说明了我们的发现，在这些电路中我们发现在所有分离处存在真实的三方纠缠。在临界点，我们的数据与三体幂律衰减一致，其指数严格大于双体对数负值的指数。我们也探讨了四体情况。最后，我们讨论了这种方法如何为广泛类别的量子电路和架构中的纠缠动力学提供根本性的见解。

2025-03-24更新2024-04-24 发布

基于伪标签的半监督目标检测（SSOD）通过有效利用标注数据和未标注数据显著减少了对大规模标注数据集的依赖。然而，SSOD在现实世界中的应用经常面临类别不平衡、标签噪声和标注错误等关键挑战。我们深入分析了现实条件下SSOD的问题，揭示了次优伪标签产生的原因以及标签质量和数量之间的关键权衡。基于我们的研究结果，我们提出了四个可以无缝集成到SSOD框架中的构建模块。稀有类别拼贴（RCC）：一种数据增强方法，通过创建稀有物体的拼贴来增强稀有类别的表示。稀有类别聚焦（RCF）：一种分层批量采样策略，确保训练过程中所有类别的平衡表示。真实标签校正（GLC）：一种标签精化方法，通过利用教师模型预测的一致性来识别并修正虚假、缺失和嘈杂的真实标签。伪标签选择（PLS）：一种通过新颖的指标估计遗漏检测率并考虑类别稀有性来去除低质量伪标签图像的选择方法。我们在自动驾驶数据集上进行了全面实验，验证了我们的方法，使SSOD性能提高了多达6%。总体而言，我们的研究和提出的以数据为中心且广泛适用的构建模块使复杂的现实场景中的鲁棒且有效的SSOD成为可能。代码可在https://mos-ks.github.io/publications获取。

计算机视觉与模式识别

机器学习

2025-03-24 发布

我们为具有粒子-空穴对称性的超导Anderson杂质模型的亚阈值自旋双重态和自旋单重态本征态提出了一组变分波函数。这些波函数包括连续区域内最多两个Bogoliubov准粒子，这对于在所有参数范围内正确捕捉弱耦合渐近行为是必要的。本征值问题归结为求解超越方程。我们研究了最低的自旋单重态随电荷排斥力$U$增加时的演化过程，从一个近邻化状态（空态和双占据杂质轨道的叠加，对应于Andreev束缚态）过渡到由Bogoliubov准粒子Kondo屏蔽的局域磁矩（Yu-Shiba-Rusinov态）。这一转变发生在$U=2\Delta$处，其中$\Delta$为BCS能隙。在此点处，带边效应使本征能量尺度以奇异的方式随着$\Gamma^{2/3}$变化，其中$\Gamma$为杂化强度。远离此特殊点时，在$\Gamma \lesssim (U/2-\Delta)^2/\Delta$范围内可恢复常规的$\Gamma$-线性行为。因此，这种奇异行为扩展到了广泛的参数范围，其中包括一些当前使用的量子器件相关的参数。奇异态是一种等幅叠加态，其局部杂质电荷构型之间的涨落达到最大值。准确捕捉带边奇异现象需要连续模型，而离散（截断）模型如零带宽近似或超导原子极限无法正确描述该现象。我们确定了第二自旋单重态存在的参数空间区域：除了整个$U<2\Delta$的ABS区域外，还包括有限$\Gamma$值下$U>2\Delta$的YSR区域的一部分，只要存在一定的ABS成分混合。

超导

2025-03-24 发布

DeepSeek-R1表明，通过基于规则奖励的简单强化学习（RL）框架，长链思维（CoT）推理可以自然产生，且训练可以直接从基础模型开始——这一范式被称为零RL训练。最近大多数复现零RL训练的工作主要集中在Qwen2.5系列模型上，但我们发现这些基础模型已经表现出较强的指令跟随和自我反思能力，因此可能不具备代表性。在本研究中，我们对10种不同家族和规模的基础模型进行了零RL训练的探索，包括LLama3-8B、Mistral-7B/24B、DeepSeek-Math-7B、Qwen2.5-math-7B以及Qwen2.5系列从0.5B到32B的所有模型。通过采用调整格式奖励和控制查询难度等多种关键设计策略，我们在大多数设置下显著提高了推理准确性和响应长度。然而，通过对训练动态的仔细监控，我们观察到不同的基础模型在训练过程中表现出不同的模式。例如，响应长度的增加并不总是伴随着某些认知行为（如验证，即“啊哈时刻”）的出现。值得注意的是，我们首次在非Qwen家族的小型模型中观察到了“啊哈时刻”。我们分享了实现成功零RL训练的关键设计、研究成果和实践经验。为促进进一步的研究，我们将代码、模型和分析工具开源。

《纽约时报》对OpenAI和微软提起的版权诉讼指控OpenAI的GPT模型“记住了”《纽约时报》的文章。其他诉讼也提出了类似的主张。然而，各方、法院以及学者们对“记忆化”的定义、是否正在发生以及其版权影响存在分歧。这些争论因“记忆化”本质的模糊性而更加复杂。我们试图为这一讨论带来清晰度。我们借鉴技术文献，为法律讨论提供坚实基础，并给出一个精确的记忆化定义：当（1）可以从模型中重构出（2）接近完全复制的（3）训练数据的重要部分时，即认为模型“记忆化”了该训练数据。我们将记忆化与“提取”（用户故意导致模型生成近似复制）、“反刍”（模型生成近似复制，与用户意图无关）以及“重构”（通过任何手段从模型中获得近似复制）区分开来。由此得出几个结论。（1）并非所有的学习都是记忆化。（2）记忆化发生在模型训练过程中；反刍是其结果而非原因。（3）记忆了训练数据的模型在版权意义上是一种“复制”。（4）模型不像录像机或其他通用复制技术，它更擅长生成某些类型的输出（可能是反刍的输出）。（5）记忆化不是由蓄意提取的“对抗性”用户引起的，而是模型本身固有的现象。（6）模型记忆的训练数据量是训练过程中选择的结果。（7）记忆化的模型是否会反刍取决于整个系统的架构设计。从某种非常真实的意义上说，记忆化的训练数据就在模型之中——借用《超级名模》的话，“文件就在计算机里”。

计算机与社会

2025-03-24更新2024-04-19 发布

共 13511 条搜索结果

共 13511 条

使用$S_3$量子双系统的通用电路集

钙钛矿材料中平带形成的配方：化学家的观点

评估脊柱治疗的生物标志物试验（BEST）的设计与 rationale

LHCb剥离项目：持续充分且高效地利用遗留数据

Mist：通过内存-并行性协同优化实现大规模语言模型高效分布式训练

基于质量-多样性与物理学启发约束增强符号回归

行星嵌入原行星盘中的泄漏尘埃陷阱

酉合成中的递归Cartan分解

冲击变暗对普通球粒陨石及Howardite-Eucrite-Diogenite族陨石光谱效应的研究

基于修复模型“无遮挡偏置”的免调参非模态分割

视频简单问答：面向大型视频语言模型的事实性评估

具有非线性电动力学耦合的Cotton引力中的黑洞解

部分可换结构中词方程的解

双投影几乎完全非线性函数的等价性问题

噪声环境下的低秩列感知问题

测量诱导转变附近长程多体纠缠的研究

鲁棒且有效的半监督现实世界目标检测构建模块

超导Anderson杂质模型的变分解及带边奇异现象

SimpleRL-Zoo：探索并驯服开放基础模型中的零强化学习

文件在计算机里：版权、记忆化与生成式人工智能