Research - arXiv

Research

arXiv

分类

本文报告了在半轻子终结态下电弱双玻色子（WW/WZ/ZZ）与高能二喷注系统关联产生的观测结果，研究了其中一个玻色子衰变为轻子而另一个衰变为强子的情况。衰变至强子的W/Z玻色子通过小半径喷注或满足喷注子结构要求的大半径喷注进行重建。所分析的数据对应于大型强子对撞机2015年至2018年期间收集的质子-质子对撞总积分亮度为140 fb⁻¹、中心-of-质量能量为√s=13 TeV的数据集。电弱WW/WZ/ZZ与两个喷注关联产生的观测值在矢量玻色子散射占主导的相空间中具有显著性7.4σ（预期6.1σ），信号强度确定为1.28⁺⁰·²³₋₀·₂₁。此外，还测量了限定相空间内的相应产生截面。通过二维拟合进一步测量了电弱和QCD关联双玻色子生产的信号强度，结果与标准模型预测一致。数据在维度-8有效场论背景下被解释，用于探测异常四阶规范耦合，从而首次给出了ATLAS合作组在半轻子通道中关于威尔逊系数的排除限值。对于S02、T0和M0算符，观察到的限制分别为(-3.96 < f_S02 / Λ⁴ < 3.96) TeV⁻⁴、(-0.25 < f_T0 / Λ⁴ < 0.22) TeV⁻⁴、(-1.26 < f_M0 / Λ⁴ < 1.25) TeV⁻⁴。

高能物理-实验

2025-03-21 发布

联邦强化学习（FedRL）通过防止代理之间直接交换数据来实现协作学习并保护数据隐私。然而，许多现有的FedRL算法假设所有代理在相同的环境中运行，这在现实中往往是不现实的。在实际应用中——例如多机器人团队、众包系统和大规模传感器网络——每个代理可能经历略有不同的转换动态，导致固有的模型失配。本文首先为单代理时序差分学习（TD(0)）在策略评估中的线性收敛性提供了保证，并证明在扰动环境中，代理会遭受系统偏差，从而阻碍真实价值函数的准确估计。该结果在独立同分布（i.i.d.）和马尔可夫采样机制下均成立。然后我们将分析扩展到联邦TD(0)（FedTD(0)）设置中，其中多个代理——每个代理与其自身的扰动环境进行交互——定期共享价值估计以协作逼近共同潜在模型的真实价值函数。我们的理论结果表明模型失配、网络连通性和混合行为对FedTD(0)收敛的影响。经验实验验证了我们的理论成果，表明即使适度的信息共享也可以显著减轻特定于环境的错误。

2025-03-21 发布

准确的降水数据对于气候服务至关重要，特别是在严重依赖雨水灌溉系统的撒哈拉以南非洲地区。由于雨量站分布稀疏，需要依赖卫星和再分析降水产品（REs）。本研究采用点对像素的验证方法，评估了赞比亚和加纳的八种降水产品：CHIRPS、TAMSAT、CHIRP、ENACTS、ERA5、AgERA5、PERSIANN-CDR 和 PERSIANN-CCS-CDR。分析涵盖了空间一致性、年降水量总结、季节性模式以及 38 个地面站点的降水强度检测。结果表明，没有单一产品在所有情境下表现最优，这凸显了应用特定建议的重要性。所有产品在赞比亚和加纳北部的干燥日检测中表现出较高的命中率（POD，70% < POD < 100%，60% < POD < 85%，分别），表明它们在干旱相关研究中的实用性。然而，所有产品在检测强降雨和暴雨时技能有限（POD 接近于 0%），使其当前形式不适合分析此类事件（如洪水）。集成站点数据的产品（ENACTS、CHIRPS 和 TAMSAT）在许多情况下表现优于其他产品，强调了本地观测校准的重要性。由于不同降水总结中的偏差水平不一，强烈建议进行偏差修正。亟需改进的关键领域是强降雨和暴雨的检测，这是目前 REs 面临的挑战。未来的研究应重点关注这一方面。

2025-03-21更新2025-01-22 发布

我们研究了实三阶张量的次秩，并给出了一个实张量的次秩对其复次秩的上界。通过类似于Bernardi-Blekherman-Ottaviani所用的论证方法，我们证明了所有介于最小典型次秩与最大典型次秩（等于通用次秩）之间的次秩也是典型的。接着，我们研究了具有多个典型次秩的小型张量格式。特别是，我们构造了一个次秩为2的$3 \times 3 \times 5$张量，并证明了$4 \times 4 \times 4$四元数乘法张量的次秩为2。最后，我们考虑了$\mathbb{C}^n$中分量复数乘法对应的张量，并证明该张量的真实次秩为$n$——非正式地说，使用能进行$n$个复数标量乘法的设备，最多只能完成$n$个实数标量乘法。我们还对其他实数除法代数证明了类似的结果。

15A69, 14P10, 17A35, 14N07

2025-03-21 发布

基于相机的生命体征监测（也称为成像光电容积描记法，iPPG）已在驾驶员监控、手术环境中的灌注评估、情感计算等领域得到应用。iPPG 涉及从皮肤视频中感知潜在的心脏脉搏，并估算心率或完整的脉搏波形等生命体征。一些先前的 iPPG 方法对脉冲信号施加基于模型的稀疏先验，并使用迭代优化进行脉搏波恢复，而其他方法则采用端到端的黑盒深度学习方法。相比之下，我们引入了一种结合信号处理和深度学习的方法，将其置于逆问题框架中。我们的方法通过学习基于深度网络的去噪算子，利用深度算法展开和深度平衡模型，从面部视频中估计潜在的脉搏信号和心率。实验表明，我们的方法可以去噪从面部获取的信号并推断正确的潜在脉搏率，在知名基准测试中实现了最先进的心率估算性能，且可训练参数数量不到最接近竞争方法的五分之一。

计算机视觉与模式识别

图像与视频处理

2025-03-21 发布

网络上的动力系统本质上是高维的，除非节点数量非常少。网络科学中提出的一类降维方法旨在找到一个显著降低维度的动力系统，同时保留原系统的关键性质（如分岔结构）。这类方法通常涉及寻找一个一维（或低维）系统，该系统近似满足网络中所有节点状态变量的某种加权平均值所遵循的动力学规律。我们针对稠密图论对象（graphons）上的非线性动力系统，对该降维技术进行了形式化表述和数学分析。首先，我们从理论上证明了感兴趣的动力系统连续极限的存在性，并证明了图论动力系统的解的存在性和唯一性。然后，我们推导出图论上的降维一维系统并证明其收敛性质。最后，通过数值模拟对多种图论对象及其对应的动力系统模型进行评估，以检验一维近似的准确性。

05C90, 92D25, 05C82, 34A12

2025-03-21 发布

微视频推荐正受到全球关注，并成为各年龄段人群日常服务的一部分。近期，基于图神经网络的微视频推荐在多种推荐任务中显示出性能提升。然而，现有方法未能充分考虑微视频的特点，例如新闻类微视频推荐的高时效性和兴趣频繁变化的序列交互。本文提出了一种新颖的多聚合器时序异构图神经网络（MTHGNN），用于基于序列会话的个性化新闻类微视频推荐，全面研究了微视频的特性，通过多聚合器挖掘用户偏好，捕捉用户偏好的时序和动态变化，并考虑了时效性。通过与最先进的方法进行对比，实验结果验证了我们提出的MTHGNN模型的优越性。

2025-03-21更新2025-01-05 发布

事件相机通过运动获取场景外观信息，即对于事件相机而言，运动与外观要么同时存在，要么都不存在，这被编码在输出的事件流中。以往的工作将恢复这两种视觉量视为独立任务，这不符合事件相机的本质，并忽视了两者之间的内在联系。本文提出了一种无监督学习框架，通过单一网络联合估计光流（运动）和图像亮度（外观）。从事件生成模型出发，我们推导出基于事件的光度误差作为光流和图像亮度的函数，并进一步结合对比度最大化框架，得到一个综合损失函数，为光流和亮度估计提供适当的约束。大量实验表明，我们的模型在光流（在无监督学习类别中EPE和AE分别提高了20%和25%）和亮度估计（与其他基线相比具有竞争力，尤其是在高动态范围场景下）方面均达到了最先进的性能。最后但同样重要的是，我们的模型在推理时间上比其他所有光流模型以及许多图像重建模型更短，尽管它们只输出一种量。项目页面：https://github.com/tub-rip/e2fai

计算机视觉与模式识别

图像与视频处理

2025-03-21 发布

本文研究了在整数格上对知识传播建模的一种自然变体的接触过程。每个站点的知识通过一个从0（无知）到1（全知）的实数值来表征。邻居以速率$\lambda$相互作用，这会导致两个邻居尝试互相传授其知识的$\mu$倍，并且个体以速率1死亡，这意味着会出现一个没有任何知识的新个体。从单个全知站点开始，我们的目标是研究格点上的总知识量是否会收敛为零（灭绝）或保持远离零（生存）。当$\lambda \leq \lambda_c$和/或$\mu = 0$时，该过程会灭绝，其中$\lambda_c$表示接触过程的临界值。相比之下，我们证明了对于所有$\lambda > \lambda_c$，$\mu$的方向存在唯一的相变；而对于所有$\mu > 0$，$\lambda$的方向也存在唯一的相变。我们的生存证明依赖于块构造，更普遍地表明知识趋于无穷大；而我们的灭绝证明则依赖于鞅技术，更普遍地表明知识呈指数衰减。

2025-03-21 发布

我们研究了Terzan 5（以下简称Ter5）与银河系核球之间的化学联系，通过观测到的[$\alpha$/Fe]丰度比随[Fe/H]变化的分布以及适当的统计测试来评估其显著性。此外，我们还基于所有可用的观测特征，对Ter5的动力学和演化特性进行了全面回顾，并根据这些观测事实和近期对其恒星形成及化学富集历史的建模，总结了文献中关于Ter5形成与演化的各种场景。这一分析证实了这个巨大恒星系统的复杂性，提供了核球原位形成的有力证据，并表明其随后的演化不能简单地归因于文献中提出的两个球状星团或一个球状星团与一个巨型分子云合并/吸积事件，而需要更为复杂的恒星形成过程，可能伴随着一定程度的自富集现象。

星系天体物理学

太阳和恒星天体物理学

2025-03-21 发布

我们引入了一类停车函数的广义形式，其中车辆在前后移动时受到两个非负整数参数 $k$ 和 $\ell$ 的限制。在这种情况下，一条单向街道上有 $n$ 个停车位，$m$ 辆车试图停放在这些车位上，且满足 $1 \leq m \leq n$。我们令 $\alpha = (a_1, a_2, \ldots, a_m) \in [n]^m$ 表示车辆的停车偏好，车辆依次进入街道。第 $i$ 辆车驶向其偏好位置 $a_i$，如果该位置可用则停车；否则，它会向前或向后检查最多 $k$ 和 $\ell$ 个车位，尝试在遇到的第一个可用车位停车。若无可用车位，则返回偏好位置，并从偏好位置开始尝试停在后续连续的车位中。若第 $i$ 辆车无法停车，则停车过程终止。若所有车辆都能根据偏好 $\alpha$ 停车，则称 $\alpha$ 为一个 $(k, \ell)$-拉回 $(m, n)$-停车函数。我们的主要结果通过两种方式对这些停车函数进行了计数：基于车辆最终停车顺序的计数以及递归公式。当 $\ell = n-1$ 时，我们的结果给出了 $k$-Naples $(m, n)$-停车函数数量的新公式；进一步令 $m = n$ 时，恢复了 Christensen 等人给出的 $k$-Naples 停车函数的数量公式。当 $k = \ell = 1$ 时，得到 vacillating $(m, n)$-停车函数数量的公式，这是 Fang 等人研究的 vacillating 停车函数的推广；令 $m = n$ 的结果回答了一个由作者提出的问题。最后，我们讨论了一些进一步研究的方向。

2025-03-21 发布

本研究利用完整运行期2的数据样本，通过双轻子衰变模式信号，对与顶夸克对或单个顶夸克与$W$玻色子关联产生的赝标量$a$进行搜寻，该赝标量玻色子随后衰变为底夸克对（$a\rightarrow b\bar{b}$）。研究覆盖了伪标量玻色子质量从12到100 GeV的范围，并考虑了两种动力学情形：一种是赝标量的衰变产物被重建为两个标准的$b$标记小半径喷注；另一种是由于赝标量的洛伦兹增强，其衰变产物合并为一个大半径喷注。未观测到显著超额结果。假设衰变分支比BR($a\rightarrow b\bar{b}$)=100%，当赝标量与顶夸克耦合强度为0.5时，排除了伪标量质量在50至80 GeV范围内95%置信水平下的可能性；而对于所考虑的质量范围，当耦合强度定义为标准模型Yukawa耦合强度的修正因子时，耦合强度为1.0也被排除在95%置信水平之外。

高能物理-实验

2025-03-21 发布

催化作用，尤其是非均相催化，在化学工业和能量存储领域至关重要。大约80%由非均相催化生产的化学品是由固体催化剂合成的，这些催化剂对于氨、甲醇和碳氢化合物的合成尤为重要。尽管广泛应用，催化剂开发仍面临诸多挑战，包括提高选择性、稳定性和活性。这些有效性能受催化剂纳米尺度形态的影响，其中纳米颗粒的尺寸仅为关键描述符之一。为了研究纳米颗粒形态与催化性能之间的关系，需要对纳米级催化剂颗粒进行全面的三维分析。然而，传统成像技术如透射电子显微镜（TEM）大多局限于二维记录。因此，本文提出了一种随机三维模型，用于基于数据驱动的催化剂颗粒纳米结构分析。该模型通过来自两个不同长度尺度的二维TEM数据进行校准，实现了统计上有代表性的催化剂颗粒三维建模。此外，可以通过该随机三维模型绘制催化剂颗粒的数字孪生体，用于虚拟材料测试，增强对催化剂纳米结构与性能之间关系的理解。

2025-03-21 发布

本文提出了一种基于数学规划的算法，用于地理加权回归（一种允许核带宽和回归系数在研究区域变化的局部回归方法）中的变量子集选择和带宽估计集成问题。与文献中标准方法不同的是，后者基于不同的标准分别针对每个焦点点估计带宽和回归参数，我们的模型通过回归似然函数和方差建模，使用单一目标函数对所有焦点点的回归和带宽参数进行集成估计。该模型进一步整合了一个为所有焦点点选择单一独立变量子集的过程，而现有方法可能返回各焦点点间异质的子集。我们随后提出了一种替代方向法来求解非凸数学模型，并证明其收敛到部分极小值。计算实验表明，所提出的算法具有较强的解释能力，能够稳定地捕捉空间变化模式，具备选择最佳子集并考虑额外约束的能力。

2025-03-21 发布

我们介绍了KL3M分词器，这是一组专为法律、金融和政府文本设计的分词工具。尽管在分词研究方面已有大量成果，但针对专业领域的专用分词器仍缺乏深入研究。本文在这一领域做出了两项主要贡献。首先，我们为法律、金融和政府文本引入了领域特定的BPE分词器。我们的kl3m-004-128k-cased分词器在处理领域特定文档时，相较于GPT-4o和Llama3使用的词汇量更小，但所需tokens数量减少了9%-17%。对于专业术语，我们的带大小写敏感的分词器表现更为高效，对法律术语的token数量减少了高达83%，对金融术语则减少了39%。其次，我们开发了用于文本校正任务（如OCR后处理）的字符级BPE分词器（词汇量分别为4K、8K和16K）。这些分词器能够保持错误文本与正确文本之间token边界的稳定性，从而帮助模型更容易学习到校正模式。这些分词器通过增加上下文窗口内的文本容量、减少计算需求以及保留领域特定术语的意义，有助于专业应用的发展。我们的分析表明，这些效率提升直接有益于长篇法律和金融文件的处理。我们将所有分词器及相关代码通过GitHub和Hugging Face公开发布，以支持该领域进一步的研究。

计算与语言

2025-03-21 发布

实现轻松且精确的分割，并最大程度减少临床医生的工作量，可以极大地优化临床工作流程。受METAs Segment Anything启发的最新交互式分割模型取得了显著进展，但在三维放射学领域面临一些关键限制，例如对三维数据进行二维模型逐层操作的人机交互需求不切实际，以及缺乏迭代优化。先前的研究由于评估协议不足，导致性能评估不可靠，不同研究之间的结果也不一致。RadioActive基准通过为临床相关场景中的交互式分割方法提供严格且可重复的评估框架解决了这些问题。它具有多样化的数据集、广泛的靶结构范围，以及最先进的二维和三维交互式分割方法，所有这些都包含在一个灵活且可扩展的代码库中。我们还引入了先进的提示技术，减少了交互步骤，从而实现了二维和三维模型之间的公平比较。令人惊讶的是，在仅需少量交互即可为三维体积生成提示的设置中，SAM2在所有专门的医学二维和三维模型中表现最佳。这挑战了现有的假设，并证明了通用模型优于专门的医学方法。通过开源RadioActive，我们邀请研究人员集成他们的模型和提示技术，确保对三维医学交互模型进行持续且透明的评估。

计算机视觉与模式识别

2025-03-21更新2024-11-12 发布

随着对代码质量保证需求的增长，开发者不仅在利用现有的静态代码检查器，还寻求定制化的检查器以满足特定需求。目前，各种代码检查框架提供了广泛的检查器定制接口以满足这一需求。然而，大规模检查器框架的抽象检查逻辑以及复杂的API使用使得这项任务具有挑战性。为此，人们期望实现自动化的代码检查器生成以减轻检查器开发的负担。本文提出了一种名为AutoChecker的创新方法，该方法基于规则描述和测试套件，通过大型语言模型（LLMs）自动生成代码检查器。为了实现全面的检查逻辑，AutoChecker每次专注于解决一个选定的案例，并逐步更新检查器逻辑。为了获取精确的API知识，在每次迭代中，它利用细粒度的逻辑引导的API上下文检索，即将检查逻辑分解为一系列子操作，并为每个子操作检索相关的API上下文。在评估方面，我们使用多个LLMs，应用AutoChecker、五个基线方法以及三种消融方法，针对从PMD规则集中随机选择的20条规则生成检查器。实验结果显示，AutoChecker在所有有效性指标上均显著优于其他方法，平均测试通过率为82.28%。此外，由AutoChecker生成的检查器能够成功应用于实际项目，其性能可媲官方检查器。

2025-03-21更新2024-11-11 发布

联邦学习（FL）因其能够从分散的数据源中进行学习而备受关注。鉴于联邦学习在决策场景中的广泛应用，解决联邦学习中不同敏感组群（如女性、男性）的公平性问题至关重要。当前研究主要集中于促进每个客户端数据（局部公平性）或整个数据集跨所有客户端（全局公平性）的公平性。然而，专注于单一局部或全局公平性的现有方法未能解决两个关键挑战：(\textbf{CH1}) 在统计异质性下，全局公平性并不意味着局部公平性，反之亦然；(\textbf{CH2}) 在模型不可知设置下实现公平性。为了解决上述挑战，本文提出了一种新颖的后处理框架，用于在联邦学习环境中实现局部和全局公平性，即LoGoFair。为应对CH1，LoGoFair致力于在局部和全局公平性约束下寻求贝叶斯最优分类器，这在概率意义上实现了准确性与公平性的最佳平衡。为应对CH2，LoGoFair采用了一种模型不可知的联邦后处理程序，使客户端能够在确保局部公平性的同时协同优化全局公平性，从而在联邦学习中实现最优的公平分类器。在三个真实世界数据集上的实验结果进一步证明了所提出的LoGoFair框架的有效性。

分布式、并行与集群计算

2025-03-21 发布

量子多体系统的显著特征之一是希尔伯特空间维度随自由度数量呈指数增长。这种指数复杂性使得通过完全区域的双划分Renyi熵完整表征量子态成为一项具有挑战性的任务。最近提出了一种通过虚构量子波函数（称为纠缠特征）的幅度存储子区域纯度的紧凑方法。值得注意的是，即使对于高度纠缠的量子态，纠缠特征也可以保持简单形式。然而，对于一般量子态而言，纠缠特征的复杂性和实际应用尚未被充分探索。本文中，我们证明了在假设其可以用有限的矩阵乘积态（MPS）表示的情况下，可以通过所谓的张量交叉插值（TCI）算法，仅需多项式数量的样本即可高效学习纠缠特征。我们通过Haar分布和随机MPS态对这一学习过程进行了基准测试，验证了理论预期。我们将TCI算法应用于一维量子系统的各种本征态，识别出可被TCI学习的本征态情况。最后，我们探讨了所学习的纠缠特征可能的应用，例如量化不同纠缠模式之间的距离以及在给定态中找到最优的一维物理指标排序，强调了提议的纯度插值方法的潜在实用性。

无序系统与神经网络

2025-03-21 发布

在对称正定（SPD）锥中估计矩阵对于从计算机视觉到图学习的许多应用都具有重要意义。尽管存在各种基于凸优化的估计器，但由于其基于模型的方法，它们的表达能力仍然受到限制。深度学习的成功促使人们采用基于学习的方法，以数据驱动的方式利用神经网络估计SPD矩阵。然而，设计有效的SPD学习神经架构具有挑战性，特别是当任务需要额外的结构约束（如元素级稀疏性）时。当前的方法要么无法确保输出满足所有所需特性，要么缺乏表达能力。在本文中，我们引入了SpodNet，这是一种新颖且通用的学习模块，能够保证SPD输出并支持额外的结构约束。值得注意的是，它解决了联合学习SPD和稀疏矩阵这一具有挑战性的任务。我们的实验展示了SpodNet层在这类应用中的多样性和相关性。

2025-03-21更新2024-06-13 发布

共 13511 条搜索结果

共 13511 条