Research

arXiv

分类

在机器学习模型中表征原子构型已经产生了许多描述符，通常用于描述原子的局域环境。然而，许多这些描述符是不完整的和/或函数相关的。不完整的描述符集无法表示原子环境中所有有意义的变化。另一方面，完整的原子环境描述符构造往往具有高度的功能相关性，其中一些描述符可以写成其他描述符的函数。这些冗余描述符不能提供额外的能力来区分不同的原子环境，并增加了计算负担。通过利用模式识别文献中的技术对现有的原子表示进行处理，我们去除了那些是其他描述符函数的描述符，从而得到满足完整性的最小可能集合。我们将这种方法应用于两种方式：首先，我们改进了一个现有的描述符，即原子簇展开。我们证明这产生了一组更高效的描述符。其次，我们增强了一个基于标量神经网络的不完整构造，通过利用一组最优的笛卡尔张量不变量，得到了一种新的消息传递网络架构，每个神经元能够识别高达五体模式。该架构在最先进的基准测试中表现出色，同时保持了较低的计算成本。我们的结果不仅提高了模型性能，还为众多应用提供了最小化成本并最大化表达能力的不变基类别的方向。

化学物理

计算机视觉与模式识别

机器学习

2025-04-03更新2025-03-30 发布

光电容积脉搏波描记法（Photoplethysmography, PPG）是一种广泛应用于消费类和医疗设备中的非侵入式技术，用于监测心血管健康和各种生理参数。虽然动态环境下的运动伪影是众所周知的挑战，但在静态条件下皮肤与传感器接触不良这一关键问题却常常被现有文献忽视。这种不良接触会扭曲PPG信号形态，导致重要波形特征的丢失或偏移，从而降低传感性能。在本研究中，我们提出了一种名为CP-PPG的新方法，该方法能够将因接触压力导致失真的PPG信号转化为具有理想形态的信号。CP-PPG结合了创新的数据采集方法、精心设计的信号处理流程以及经过自定义PPG感知损失函数训练的先进深度对抗模型。我们通过全面评估验证了CP-PPG的效果，包括：1）在自收集数据集上的形态变换性能；2）在公开数据集上的下游生理监测性能；3）实际环境下的表现。大量实验表明，在心率（HR）、心率变异性（HRV）、呼吸频率（RR）和血压（BP）估计的信号保真度（平均绝对误差：0.09，较原始信号提高了40%）以及所有评估中的下游性能均有显著且一致的提升（HR平均提高21%，HRV提高41%-46%，RR提高6%，BP提高4%-5%）。这些结果突显了解决皮肤传感器接触问题对于准确可靠的基于PPG的生理监测的重要性。此外，CP-PPG可以作为一种通用的插件API来提升PPG信号质量。

人机交互

机器学习

2025-04-03 发布

给定一个概率测度值过程$(\mu_t)$，在所有一维时间边缘分布几乎必然与$(\mu_t)$一致（如果存在的话）的路径连续随机过程中，我们寻求一种期望意义下最小化给定能量的过程。基于我们近期的研究（arXiv:2502.12068），其中探讨了Wasserstein空间上确定性路径的分数阶Sobolev能量最小化问题，我们现在将结果推广到随机情形，以解决一些最初激发我们研究的应用问题。给出两个应用。利用最优传输方法，我们构造了$\mathbb{R}$上具有Hölder正则性的Wasserstein空间过程的最小化粒子表示。利用Lacker–Shkolnikov–Zhang的随机叠加原理（J. Eur. Math. Soc. 25, 3229–3288 (2023)），我们证明了满足可积性条件的$\mathbb{R}^\mathrm{d}$上随机Fokker–Planck–Kolmogorov方程解的最小化粒子表示的存在性。

概率论

优化与控制

46E35, 49Q22, 60G17, 60G57

2025-04-03更新2025-03-13 发布

通过操作者的经验和社会直觉，遥操作机器人可以与人类进行富有表现力的互动。在这项工作中，我们提出了一种通过训练模型来模仿操作者数据的方法，以创建自主互动机器人。我们的模型是在一个人机交互的数据集上进行训练的，其中要求一名专家操作者改变机器人的互动方式和情绪，同时记录操作者的指令以及人类和机器人的姿态。我们的方法通过扩散过程预测连续的操作命令，并通过分类器预测离散命令，所有这些都统一在一个单一的Transformer架构中。我们在仿真环境中评估了所得到的模型，并在真实系统上进行了用户研究。结果显示，我们的方法能够实现与专家操作者基线相当的简单自主人机互动，并且用户可以识别出由我们的模型生成的不同机器人情绪。最后，我们展示了该模型在具有相同操作界面的不同机器人平台上的零样本迁移能力。

机器人学

人工智能

2025-04-03 发布

我们研究了从任意分布中学习高密度区域的问题。给定目标覆盖参数$\delta$以及对任意分布$D$的样本访问权限，我们的目标是输出一个置信集$S\subset \mathbb{R}^d$，使得$S$达到$D$的$\delta$覆盖，即$\mathbb{P}_{y \sim D}[y \in S] \geq \delta$，并且$S$的体积尽可能小。这是高维统计学中的核心问题，具有在置信集构建、不确定性量化和支持估计中的应用。在最一般的情况下，该问题是统计上不可处理的，因此我们将注意力限制在与具有有界VC维的概念类$C$竞争。算法与类$C$竞争的条件是：给定来自任意分布$D$的样本，它能在多项式时间内输出一个实现$D$的$\delta$覆盖且其体积与具有所需覆盖$\delta$的最小集合相比具有竞争力的集合。即使在$C$为所有欧几里得球体集合的基本情况下，这个问题也是计算上具有挑战性的。现有的基于核的方法可以在多项式时间内找到一个体积为最佳球体体积的$\exp(\tilde{O}(d / \log d))$倍的球体。我们的主要结果是一种算法，它能找到一个置信集，其体积是具有所需覆盖的最优球体体积的$\exp(\tilde{O}(d^{2/3}))$倍。该算法是非适当的（输出一个椭球）。结合我们关于适当学习球体在体积上达到$\exp(\tilde{O}(d^{1-o(1)}))$近似因子的计算不可处理性结果，我们的研究结果在置信集的适当学习与（非适当）学习之间提供了一个有趣的分离。

在脆性断裂的相场理论中，裂纹起始、扩展及路径选择通过非凸能量泛函和稳定性准则进行研究。由于状态变量相对于凸性的缺乏，旨在同时求解运动学变量和内部变量的整体求解器面临困难。本文探讨了拟牛顿算法作为一种替代传统牛顿-拉弗森求解器的方法的有效性。这些算法通过构造Hessian的正定近似来改善收敛性，但可能错过分岔点和稳定性阈值。我们的研究集中在弹性基底上的脆性薄膜一维相场断裂模型。在此框架下，在没有不可逆性约束的情况下，我们利用已知的分支跟踪分岔技术构建了一个平衡图，该图表示了外部载荷作用下所有稳定和不稳定平衡状态。我们的主要发现是，拟牛顿算法在没有精确二阶变化信息的情况下无法选择稳定的演化路径。为了解决这一问题，我们对完整的Hessian进行了谱分析，提供了最优扰动，使拟牛顿方法能够遵循裂纹演化的稳定且可能是唯一的路径。我们讨论了当存在损伤不可逆性时的稳定性问题和最优扰动，这会改变可接受扰动集合的拓扑结构，需要专门的非线性约束特征值求解器。

模式形成与孤子

74R10, 65P30, 70K50, 70K20

2025-04-03更新2024-09-06 发布

Zimmer关于高秩李群及其格点的超刚性定理开启了研究半单李群及其格点作用的纲领，被称为“Zimmer纲领”。当群相对于相空间维数过大时，Zimmer猜想预测这些作用本质上都是平凡的。在另一个极端情况下，当作用表现出足够的正则性时，这些作用应都来源于代数结构。我们通过证明在保持体积的部分双曲作用下，半单李群（无紧因子和秩一因子）的作用在有限覆盖下光滑共轭于双齐次模型，从而对该纲领取得进展。这一结果基于两个关键假设：对大类元素的部分双曲性（完全部分双曲性）以及可访问性，即由动力学定义的叶状结构生成的网满足一定条件。此外，对于满足更强假设的高秩交换群作用，我们也得到了分类结果。

动力系统

2025-04-03更新2022-11-15 发布

我们展示了如何在保结构噪声和耗散的随机哈密顿系统背景下解释 Langevin 扩散。简约李群为李群结构与黎曼结构的兼容性提供了框架，这得益于双不变度量的存在。这种结构允许通过辛技术显式构造黎曼布朗运动，从而研究位置坐标存在噪声的 Langevin 扩散以及动量和位置均存在噪声的 Langevin 扩散。

概率论

2025-04-03 发布

我们为广义$p$-罗宾问题的第一特征值建立了严格的定量不等式，适用于经典扩散吸收情形（其中罗宾边界参数$\alpha$为正）以及超导生成区域（$\alpha<0$，此时边界作为源）。在有界域中，我们采用统一的方法推导出所有$p$和所有小实数$\alpha$的精确渐近行为，改进了现有结果的多个方面，包括放宽了经典2-罗宾问题的边界正则性要求（该问题在Rene Sperb的经典工作中研究）。在外延域中，我们刻画了特征值的存在性，建立了$\alpha\to 0$时外延球体外部第一特征值的一般不等式和渐近公式，并得到了二维凸域的一些尖锐几何不等式。

PDE分析

谱理论

2025-04-03更新2024-08-12 发布

我们在指数时间假设（ETH）下证明了格问题的一些新难度结果。基于Bitansky等人最近的一项突破性工作[BHIRW24]，他们给出了从$\mathsf{3SAT}$到(gap)$\mathsf{MAXLIN}$问题（一类具有有限域上线性方程组的CSP）的一个多项式时间约简，我们推导出了几个格问题的ETH难度。首先，我们证明了对于任意$p \in [1, \infty)$，存在一个明确的常数$\gamma > 1$，使得$\mathsf{CVP}_{p,\gamma}$（$\ell_p$-范数近似最近向量问题）不接受$2^{o(n)}$时间算法，除非ETH为假。我们的约简是确定性的，并通过直接从(gap)$\mathsf{MAXLIN}$到$\mathsf{CVP}_{p,\gamma}$的约简实现。接下来，我们证明了对于所有$p > 2$，$\mathsf{SVP}_{p,\gamma}$（$\ell_p$-范数近似最短向量问题）的随机化ETH难度结果。此结果依赖于整数格$\mathbb{Z}^n$在$\ell_p$范数下的一个新颖性质以及从$\mathsf{CVP}_{p,\gamma}$到$\mathsf{SVP}_{p,\gamma'}$的随机化约简。最后，我们改进了从$\mathsf{3SAT}$到$\mathsf{BDD}_{p, \alpha}$（有界距离解码问题）的先前约简，得到了对于任何$p \in [1, \infty)$和$\alpha > \alpha_p^{\ddagger}$（其中$\alpha_p^{\ddagger}$是依赖于$p$的明确阈值）的$\mathsf{BDD}_{p, \alpha}$更好的ETH难度结果。此外，我们注意到先前的工作表明在代码中的间隙最小距离问题($\gamma$-$\mathsf{MDP}$)具有ETH难度。

内函数是全纯函数理论的核心。本文研究了在有限伪反射群作用下由开单位多项式域$\bD^d$生成的商域上的内函数。此类商域已知与其通过某些多项式映射$\theta: \bD^d \to \theta(\bD^d)$的适当像$\theta(\bD^d)$双全纯。本文的主要贡献如下：1) 我们证明了在$\theta(\bD^d)$上由内函数生成的闭代数构成了$H^\infty(\theta(\bD^d))$（即$\theta(\bD^d)$上的有界全纯函数代数）的一个真子代数；2) 证明了$\theta(\bD^d)$上的所有有理内函数在均匀紧致拓扑下关于$H^\infty(\theta(\bD^d))$的单位球在范数意义下是稠密的，从而证明了Carathéodory逼近结果；3) 利用Carathéodory逼近定理，我们通过$\theta(\bD^d)$闭包内连续的全纯函数的$L^2$范数逼近，得到了Fisher定理的一个版本；4) 鉴于上述两个逼近结果，确定有理内函数的结构至关重要。我们已经确定了$\theta(\mathbb{D}^d)$上的有理内函数的结构；5) 还讨论了算子值函数的Carathéodory逼近问题。

函数分析

32A17, 46J20, 32E30, 47A56, 58D19

2025-04-03更新2022-08-16 发布

考虑一个Moran型迭代函数系统（IFS）$ \{\phi_{k,d}\}_{d\in D_{2p_k}, k\geq 1} $，其中每个压缩映射定义为 \[ \phi_{k,d}(x) = (-1)^d b_k^{-1}(x + d), \] 并且整数序列 $ \{b_k\}_{k=1}^\infty $ 和 $ \{p_k\}_{k=1}^\infty $ 满足 $ b_k \geq 2p_k \geq 2 $，以及 $ k \geq 1 $ 时的数字集 $ D_{2p_k} = \{0, 1, \ldots, 2p_k - 1\} $。我们首先证明该IFS唯一生成一个Borel概率测度 $ \mu $。此外，在满足可整除性约束条件 \[ p_2 \mid b_2, \quad 2 \mid b_2, \quad \text{且} \quad 2p_k \mid b_k \ \text{对于} \ k \geq 3, \] 且 $ \{b_k\}_{k=1}^\infty $ 有界的情况下，我们证明 $ \mu $ 是一个谱测度，即 $ L^2(\mu) $ 存在一个指数函数的正交基。为了完全刻画其谱性，我们引入了多阶段分解策略用于谱的分析。通过附加假设所有参数 $ p_k $ 都为偶数，我们建立了关于 $ \mu $ 的谱性的完整刻画。这一结果统一并扩展了文献 \cite{An-He2014, Deng2022, Wu2024} 中提出的研究框架，提供了一个此类测度的广义判据。

函数分析

经典分析与常微分方程

Primary 28A80, Secondary 42B10, 42C05

2025-04-03更新2024-12-18 发布

设$\{A_{i,n}\}$为Banach代数中的三角阵列，其范数增长不快，且行平均值收敛至$A$。设$\sigma \in S(n)$为均匀随机抽取的置换。若该阵列仅包含$o(n / \log n)$个不同的元素，则几乎必然地，对于所有$0 < s < t < 1$，它们的指数的重排乘积$\prod_{i = [s n]}^{[t n]} e^{A_{\sigma(i),n}/n}$按范数收敛至$e^{(t - s) A}$。对于有限维矩阵的阵列，无需此限制即可保证收敛。后一结果的证明包括适用于一般Banach代数的一个估计，以及对矩阵集中不等式的一种应用。

基于从经典脉冲星（CPs）和毫秒脉冲星（MSPs）的无线电脉冲星群体综合形成的可靠银河系中子星群体，我们利用最新的费米伽马射线太空望远镜 LAT 第四版目录（4FGL-DR4），研究了提出的γ射线亮度模型的含义。通过蒙特卡罗技术，我们计算了在4FGL-DR4中可能包含的脉冲星样未识别源（PLUIDs）中的经典脉冲星和毫秒脉冲星的数量。在构建模拟的4FGL-DR4样本时，我们使用无线电波束分数对群体规模进行了缩放，并假设所有γ射线脉冲星都朝向地球辐射。随后，我们探讨了七种不同的γ射线亮度模型的可观测结果。其中四种模型很好地匹配了观测到的PLUIDs数量，而另外三种模型则显著高估了PLUIDs的数量。对于后者，要么γ射线脉冲星的平均波束分数更接近25%–50%，要么需要调整亮度标度。我们模型预测的大部分可在无线电中探测到的MSPs，不出所料地比当前观测样本更微弱且具有更大的色散测量值。对于CPs，尽管与观测到的无线电群体非常匹配，但我们研究的所有γ射线模型都无法复制已知的150个γ射线CP样本。需要进一步工作来理解这一差异。对于MSPs和CPs，我们为从4FGL-DR4中针对PLUIDs进行定向无线电搜索提供了令人鼓舞的预测，以阐明本研究提出的问题。

高能天体物理现象

2025-04-03 发布

为了实现更低开销的量子容错，量子低密度奇偶校验码（QLDPC）作为一种有前途的替代方案脱颖而出，其代码率高于拓扑码（如表面码），在降低量子计算复杂度方面具有显著优势。为支持对QLDPC码的研究，需要一个端到端的电路级模拟框架。本文提出了一种名为QUITS的模块化且灵活的QLDPC码电路级模拟器。其设计允许用户自由组合LDPC码构造、校验提取电路、解码算法和噪声模型，从而全面且可定制地研究电路级噪声下QLDPC码的性能表现。QUITS支持几种领先的QLDPC码族，包括超图积码、提升积码和平衡积码。作为框架的一部分，我们引入了一种改进的校验提取电路，该电路基于Tremblay、Delfosse和Beverland [Phys. Rev. Lett. 129, 050504 (2022)] 的工作，适用于以上三种码族。特别是，对于一个小规模的超图积码，我们的电路深度低于传统方法，从而提升了逻辑性能。通过QUITS，我们在各种设置下评估了最先进的QLDPC码和解码器的性能，揭示了解码运行时间和逻辑失败率之间的权衡。QUITS的源代码已在线发布。

量子物理

2025-04-03 发布

费米问题（Fermi Problems, FPs）是需要人类逻辑和数值推理的数学推理任务，其特点在于常涉及现实世界中的不切实际或模糊概念，即使对人类而言也具有挑战性。尽管人工智能在各类推理任务中取得了显著进展，尤其是大型语言模型（Large Language Models, LLMs）的应用，但费米问题的研究相对较少。本研究开展了一项探索性研究，考察LLMs解决费米问题的能力与局限性。我们首先利用公开可用的费米问题数据集评估了三种先进LLMs的整体性能。基于最近提出的TELeR分类法设计提示词，并包括零样本情景。结果表明，这三种LLMs的fp_score（范围为0到1）均低于0.5，凸显了此类推理任务的固有难度。为进一步探究，我们将费米问题分为标准问题和特定问题，并假设LLMs在标准问题上的表现会优于特定问题，因为标准问题更清晰简洁。对比实验验证了这一假设，表明LLMs在标准费米问题上的准确性和效率均更高。

计算与语言

2025-04-03 发布

学术写作既需要连贯的文本生成，也需要精确引用相关文献。尽管最近的检索增强生成（RAG）系统在通用文本生成的事实准确性方面取得了显著进步，但它们支持专业学术写作的能力仍然有限。在这项工作中，我们引入了ScholarCopilot，这是一个统一的框架，旨在增强现有的大型语言模型，用于生成具有准确且上下文相关的引用的专业学术文章。ScholarCopilot通过生成一个检索标记[RET]动态决定何时检索学术参考文献，该标记随后用于查询引文数据库。检索到的参考文献被输入模型以增强生成过程。我们在单一框架内联合优化生成和引文任务以提高效率。我们的模型基于Qwen-2.5-7B，并在arXiv的50万篇论文上进行了训练。在我们的评估数据集上，其top-1检索准确率达到40.1%，优于基线模型如E5-Mistral-7B-Instruct（15.0%）和BM25（9.8%）。在包含1000个学术写作样本的数据集上，ScholarCopilot在生成质量上得分16.2/25——从相关性、连贯性、学术严谨性、完整性和创新性方面衡量——显著超越了所有现有模型，包括更大的模型如检索增强的Qwen2.5-72B-Instruct。人类研究进一步表明，尽管ScholarCopilot是一个7B参数的模型，但它在引文质量和整体实用性方面显著优于ChatGPT，获得了100%的引文质量偏好和超过70%的整体有用性偏好。

计算与语言

2025-04-03更新2025-04-01 发布

如果要在高安全性领域应用人工智能（AI），则需要可靠地评估其性能。本研究旨在了解人类如何评估自动列车运行中的人员检测AI系统。在三项实验中，参与者观看了靠近铁路轨道移动的人的图像序列。一个模拟的AI对所有检测到的人进行了标记，有时正确，有时不正确。参与者需要为AI的表现提供数值评分，并口头解释他们的评分。这些实验操纵了可能影响人类评分的多个因素：AI错误的类型及其合理性、受影响图像的数量、图像中人数的数量、与轨道相关的人的位置以及诱发人类评价的方法。尽管所有这些因素都会影响人类的评分，但有些效果出乎意料或偏离了规范标准。例如，影响最大的因素是人与轨道之间的相对位置，尽管参与者明确被告知AI无法处理此类信息。综合来看，结果表明人类有时会评估超出AI任务表现的内容。在进行AI系统的安全性审核时，应考虑到AI能力与人类期望之间的这种不匹配。

人机交互

2025-04-03 发布

我们证明了在抛物水平上的$p$-进Hecke叠的近傍循环函子是偏心t-精确的，并通过发展Iwahori水平下的Wakimoto滤过理论，表明其提升为$\mathbb{E}_1$-中心。我们利用这些工具构造了$p$-进仿射旗簇在Iwahori水平下的Arkhipov-Bezrukavnikov函子，并证明其对于所有经典群以及类型为$E_6$和$E_7$的例外群均为等价。

数论

代数几何

表示论

14M15 (primary), 13K05, 14L15, 20C08 (secondary)

2025-04-03更新2023-11-07 发布

Eberhard和Pohoata猜测，每个$3$-立方自由的$[N]$子集大小小于$2N/3+o(N)$。在本文中，我们证明了如果将$[N]$替换为$\mathbb{Z}_N$，则上界$2N/3$成立，并且当$N$能被$3$整除时该界是紧的，因为存在集合$A=\{a\in \mathbb{Z}_N:a\equiv 1,2\pmod{3}\}$。受此启发，我们推测$\mathbb{Z}_N$中的每个$d$-立方自由子集大小小于$(d-1)N/d$，其中$N$能被$d$整除，并通过提供示例$B=\{b\in\mathbb{Z}_N:b\equiv 1,2,\ldots,d-1\pmod{d}\}$证明了该界的紧性。我们对若干有趣的情况证明了该猜想，包括当$d$是$N$的最小素因数或$N$为素数幂时。我们还讨论了关于$\{x,dx\}$-自由集和$\{x,2x,\ldots,dx\}$-自由集的相关问题。我们应用的主要工具是将所有整数排列在一个方阵中，其坐标为$(s+1,l-\lfloor l/d\rfloor)$，其中$d$是给定整数，$l$不能被$d$整除。

组合学

2025-04-03更新2023-11-21 发布

共 13511 条搜索结果

共 13511 条

原子机器学习的最佳不变基

解决皮肤传感器接触不良问题以推动静态条件下PPG传感极限的研究

Wasserstein空间上的过程及分数阶Sobolev空间中的能量最小化粒子表示

通过操作者模仿实现自主人机交互

计算任意分布的高维置信集

稳定导航：梯度损伤断裂模型中的局域极小值、模式与演化

Zimmer纲领：部分双曲作用

辛技术在简约李群上随机微分方程中的应用：Langevin 扩散案例

吸收与生成$p$-罗宾特征值在有界域与外部域中的行为

警惕差距？在ETH下对SVP硬度无须担忧！

与多项式域相关的商域上的函数理论

具有交错收缩比的Moran型测度的谱性

指数的重排乘积的收敛性

γ射线和无线电脉冲星群体的蒙特卡罗评估

QUITS：一种模块化的量子低密度奇偶校验码电路模拟器

复杂推理任务中的大型语言模型：费米问题的探索性研究

ScholarCopilot：基于准确引用训练大型语言模型进行学术写作

人类如何评估用于自动列车运行中人员检测的人工智能系统：并非所有的遗漏都相同

混合特征下Gaitsgory中心函子与Arkhipov-Bezrukavnikov等价

关于立方自由问题的注记