Research

arXiv

分类

$\ell_p$ 子空间近似问题是一个NP难的低秩近似问题，它推广了中值超平面($p=1$)、主成分分析($p=2$)和中心超平面问题($p=\infty$)。为了应对NP难性，一种流行的方法是计算强核心集，即输入点的一个带权子集，该子集同时近似每个$k$维子空间的成本，通常相对于一个小常数$\epsilon$达到$(1+\epsilon)$的相对误差。我们得到了一个用于构建$\ell_p$子空间近似强核心集的算法，其大小为$\tilde{O}(k\epsilon^{-4/p})$（对于$p<2$）和$\tilde{O}(k^{p/2}\epsilon^{-p})$（对于$p>2$）。这一结果相比之前的工作有以下改进：- 对于所有$p\neq 2$，我们构造了第一个强核心集，其对$k$的依赖接近最优。在之前的工作中，[SW18] 构造了修改点的强核心集，其对$k$的依赖相似，而[HV20] 构造了真正的强核心集，但对$k$的依赖是多项式级别更差。- 对所有$p$，我们恢复或改进了最佳的$\epsilon$依赖性。特别是，对于$p>2$，[SW18] 的修改点强核心集的依赖性为$\epsilon^{-p^2/2}$，而[HV20] 的强核心集的依赖性为$\epsilon^{-3p}$。我们的算法基于根杠杆得分采样，这种方法对稀疏或结构化矩阵特别适合快速实现。我们的分析避免了使用代表性子空间定理[SW18]，这是所有先前独立维度$\ell_p$子空间近似强核心集的关键组成部分。我们的技术还导致了第一个在线强核心集，其在离线设置中的界限类似，解决了[WY23]提出的问题。所有先前的方法在这种情况下都会丢失$\mathrm{poly}(k)$因子，即使允许修改原始点。

数据结构与算法

机器学习

2025-04-03更新2024-07-03 发布

在过去二十年里，非平凡的磁性结构，尤其是磁斯格明子家族，引起了广泛的基础研究兴趣，并可能在多种潜在应用中发挥作用。鉴于斯格明子结构对磁性隧道结（Sk-MTJs）可能带来的技术与科学影响，在这项工作中，我们基于非平衡格林函数（NEGF）方法，对Néel型和Bloch型斯格明子的磁性隧道结进行了描述，以捕捉不同电压、温度和尺寸下的自旋/电荷电流。我们预测了均匀层中会涌现出一种纹理化的自旋电流，并且自旋转矩表现出径向变化且不对称的电压依赖性。我们讨论了如何通过局部测量自旋电流来识别Néel型和Bloch型斯格明子及其手性。基于透射谱分析，我们解释了小横截面积和高温度下斯格明子磁性隧道结的隧穿磁电阻（TMR）滚降现象。此外，考虑到磁性隧道结缩放的重要意义，我们揭示了双接触均含斯格明子的全斯格明子（AS）磁性隧道结的缩放效应。我们展示了缩放对TMR、自旋和电荷电流的影响，为斯格明子/全斯格明子磁性隧道结的小型化设计优化提供了路径。同时，我们引入了一种计算高效且基于解析的耦合空间-本征态NEGF框架，缓解了三维NEGF在横向缺乏平移不变性的系统（如斯格明子/全斯格明子磁性隧道结）中不可或缺的需求。

介观与纳米尺度物理

2025-04-03更新2024-03-18 发布

氧化亚氮（N$_2$O）冰可能存在于冥王星和海卫一等海王星外天体中，其形成途径可能是太阳紫外线（UV）辐射或N$_2$和CO冰受到宇宙射线照射。然而，较高温度区域（90-110 K）中N$_2$O冰的中红外光谱特征、UV辐照过程中中红外光谱的变化以及氮氧化物（N$_x$O$_y$）冰的化学网络尚缺乏充分理解。本研究通过二维成像傅里叶变换红外光谱技术对低温颗粒进行原位中红外光谱测量，以阐明这些方面。光谱成像确认了在7.75 μm处存在强吸收（N$_2$O $\nu_1$振动模式），在8.60 μm（N$_2$O 2$\nu_2$）、7.27 μm（N$_2$O 扭转模式）和5.29 μm（N$_2$O $\nu_1$+$\nu_2$）处观察到较弱的振动模式。模拟高温条件的退火实验表明，所有振动模式随温度升高不可逆地增强，表明逐渐结晶化。凝结样品在约12 μm和14 μm处出现了新的光谱特征。使用D$_2$灯对N$_2$O冰进行了8.5小时的紫外辐射（190-340 nm），以研究UV辐照过程中的光谱变化。辐照60-90分钟后，所有N$_2$O振动模式消失，而包括NO、NO$_2$、N$_2$O$_3$和O$_3$在内的各种氮氧化物的吸收强度增加。超过180分钟后，多种氮氧化物冰的振动模式在不同波长下表现出强度变化，对应于其他物质如顺式-(NO)$_2$、N$_2$O$_4$和N$_2$O$_5$。

考虑在网络中具有容量限制的边上的任意两点多商品网络流问题。传统方法在每条边上为每个源-目的对跟踪独立的流量；我们采用了一种更高效的公式，将具有相同目的地的流量聚合起来，从而将变量数量减少一个等于网络规模的因子。对于包含数百个节点、总变量数达到百万量级的问题，可以使用标准的通用内点法在CPU上进行求解；我们专注于兼容GPU的算法，这些算法可以显著加快求解速度，并且能够扩展到更大的问题，最多可达十亿变量。我们的方法依赖于原始-对偶混合梯度算法，并利用了该问题的若干特定特征以实现高效的GPU计算。数值实验表明，我们的原始-对偶多商品网络流方法比最先进的通用商业求解器加速了$100\times$至$1000\times$，并且能够处理更大规模的问题。我们提供了该方法的开源实现。

优化与控制

2025-04-03更新2025-01-29 发布

数据中心和网约车服务等实际系统在文献中常被建模为排队系统。由于其分析上的可处理性，这些系统主要在稳态下进行研究。然而，几乎所有现实生活中的应用并不处于稳态运行，因此在将理论排队结果转化为实际应用时存在明显的差异。为此，我们针对Erlang-C系统（也称为$M/M/n$队列）提供了有限时间收敛的结果，为理解更一般的排队系统的瞬态行为奠定了基础。我们得到了有限数量服务器下有限时间队列长度分布与稳态分布之间的卡方距离的一个界。然后利用这些界研究了多服务器强拥塞渐近区域的行为。Erlang-C模型在所谓的Halfin-Whitt区域表现出相变。我们证明了我们的混合速率在Super-Halfin-Whitt区域匹配极限行为，并在Sub-Halfin-Whitt区域以一个常数因子匹配。为了证明这样的结果，我们采用了李雅普诺夫-庞加莱方法，在有限集合外部首先精心设计了一个李雅普诺夫函数以获得负漂移；在有限集合内部，则根据不同属性采用不同的策略，通过局部庞加莱不等式控制混合行为。我们方法论贡献的关键方面在于在这两个区域中获得了紧致保证，当它们结合在一起时为我们提供了紧致的混合时间界限。我们认为这种方法对研究可逆可数状态马尔可夫链的混合行为具有独立的兴趣价值。

概念擦除旨在从嵌入中移除指定特征。它可以提高公平性（例如，防止分类器使用性别或种族信息）并提升可解释性（例如，移除某一概念以观察模型行为的变化）。我们提出了最小二乘概念擦除（LEAst-squares Concept Erasure, LEACE），这是一种闭式方法，能够在保证嵌入变化尽可能小的情况下，确保所有线性分类器无法检测到目标概念，同时采用广泛的范数进行度量。我们将LEACE应用于大型语言模型，并提出了一种名为“概念清洗”的新程序，该程序能够从网络的每一层擦除目标概念信息。我们在两项任务中展示了我们的方法：测量语言模型对词性信息的依赖程度以及减少BERT嵌入中的性别偏见。代码可在https://github.com/EleutherAI/concept-erasure获取。

机器学习

计算与语言

计算机与社会

2025-04-03更新2023-06-06 发布

我们证明了非局部半范数在连续Steiner重排下严格递减。这表明所有作为非局部能量临界点出现的非局部方程解都是径向对称且递减的。此外，我们通过利用径向对称且递减函数空间中的定制插值方法来展示能量的凸性，从而证明了解的唯一性。作为一个应用，我们研究了描述弹性介质中对称裂纹生长的高阶非局部方程的长时间动力学。

PDE分析

35R11, 35G20, 35C06

2025-04-03更新2023-10-20 发布

民主社会中日益加剧的政治极化是政治意见动态的涌现结果。然而，从个体信念到集体共识的政治意见形成的根本机制仍然未知。我们认识到，一个因果机制必须同时考虑自下而上和自上而下的影响，因此将政治意见动态概念化为分层粗粒化过程，其中微观层面的意见整合为宏观层面的状态变量。利用CODA（连续意见离散行动）模型，我们模拟了贝叶斯意见更新、基于社会身份的信息整合以及社会身份群体间的迁移，以表示更高级别的连通性，从而在微观、介观和宏观层面实现粗粒化。研究结果显示，更高级别的连通性塑造了信息整合，形成了三种模式：独立模式（孤立、局部收敛）、并行模式（快速、全局收敛）和迭代模式（缓慢、逐步收敛）。在迭代模式中，较低的连通性促进了暂时的多样性，表明一种知情的共识。在所有模式中，时间尺度分离导致下行因果关系，即代理人向多数选择聚合，推动共识形成。至关重要的是，任何程度的一致性更高的级别信息整合都可以通过全球下行因果关系克服错位现象。研究结果强调了因果机制的涌现特性，如下行因果关系，对于达成共识的重要性，并可能为更精确地研究极化的政治话语提供启示。

社会与信息网络

cs.MA

2025-04-03更新2025-04-01 发布

任务指导型人工智能助手的概念正迅速从科幻元素转变为即将成为现实的技术。此类系统本质上非常复杂，需要具备感知接地、注意力分配以及推理能力的模型，还需要一个能够适应操作者需求的直观界面，并协调来自多个传感器的数据流。此外，系统获取的所有数据都必须易于事后分析，以便开发人员理解操作者行为并快速检测故障。我们介绍了TIM，这是首个在增强现实中实现的端到端人工智能赋能的任务指导系统，它能够检测用户和场景，并提供可调节的即时反馈。我们讨论了系统面临的挑战并提出了设计解决方案。同时，我们展示了TIM如何针对不同需求的应用领域进行调整，突出了系统组件如何为每个场景定制化的能力。

新兴技术

人机交互

2025-04-03 发布

我们研究了欧几里得平面上（$\RR^2$）的邻域旅行商问题（TSPN），并提出了一个多项式时间近似方案（PTAS），当邻域为平行线段且长度在$[1, \lambda]$之间时，其中$\lambda \geq 1$为任意常数值。在TSPN（经典TSP的推广）中，每个客户代表度量空间中的一个点集（或邻域），目标是找到一条最小成本的旅行商巡回路径，访问每个客户集合至少一点。在欧几里得设定下，每个邻域是平面上的一个区域。即使在欧几里得设定下，TSPN比经典的TSP显著更难，因为它捕获了群体TSP。TSPN的一个显著情况是每个邻域都是一个线段。尽管对于肥体对象（具有有限重叠）的邻域存在PTAS，但对于长度统一的线段，TSPN仍然是\textbf{APX}-困难的。对于平行（单位长度）线段，二十多年前的最佳近似因子为$3\sqrt{2}$ \cite{DM03}。本文提出的算法解决了这一问题情形的近似性。我们的算法可以在时间$n^{O(\lambda/\eps^3)}$内找到问题实例的$(1+\eps)$-因子近似解，其中$n$为线段数量，长度范围在$[1,\lambda]$之间。

数据结构与算法

计算几何

2025-04-03 发布

协变量相关的图学习在分析异质数据的图形建模文献中引起了越来越多的兴趣。然而，这项任务在建模、计算效率和可解释性方面都带来了挑战。感兴趣参数可以自然地表示为一个三维数组，其元素可以根据两个方向进行分组，分别对应节点级别和协变量级别。本文提出了一种新的双组群尖峰-滑块先验，能够在协变量级别、节点级别以及个体（局部）级别实现稀疏选择。我们引入了一种嵌套策略并作出具体选择，以应对由不同分组方向带来的各种挑战。对于后验推断，我们开发了一种无需调节参数的Gibbs采样器，这减轻了高维图形模型中常见的参数调节困难，并促进了常规实现。通过模拟研究，我们证明所提出的模型在图恢复的准确性上优于现有方法。我们通过应用到微生物组数据展示了模型的实际效用，在此过程中，我们寻求更好地理解微生物之间的相互作用以及这些相互作用如何受到相关协变量的影响。

方法论

2025-04-03更新2024-09-25 发布

本文详细介绍了我们在2024年RoboCup成人组自主人形足球联赛中获胜所采用的避障、路径规划和轨迹跟踪方法。我们的团队在所有坐席比赛中保持不败，并在6场比赛中打入45球，决赛以6比1获胜。在竞赛期间，双足运动带来的测量噪声以及有限视野（FOV）是碰撞规避的主要挑战。此外，障碍物会间歇性地出现在我们计划的轨迹中。有时，我们的估计器会将机器人置于硬约束内。因此，任何参赛者都需要具备足够的计算效率，以便实时重新规划并作出反应。这促使我们开发了轨迹生成和跟踪的方法。在许多情况下，需要长期和短期规划。为了高效找到一条避开所有障碍物的总体路径，我们开发了DAVG（动态增强可见性图）。DAVG通过基于障碍物和期望目标姿态激活某些区域来进行重点路径规划。通过在图中增加状态，考虑转弯角度，这对大型足球机器人至关重要，因为转弯可能代价更高。轨迹由DAVG生成的离散点线性插值得到。然后使用修改后的模型预测控制（MPC），称为cf-MPC（无碰撞MPC），来跟踪该轨迹，以确保短期规划。cf-MPC无需切换公式即可同时考虑机器人动力学和无碰撞约束。在噪声导致机器人处于约束边界内时，由于没有硬切换，控制输入可以平滑过渡。非线性公式大约以120 Hz运行，而二次版本则达到约400 Hz。

图像配准旨在估计一对图像之间的空间对应关系。这些估计通常是通过数值优化或深度网络回归获得的。这类估计器的一个理想属性是，对于一对图像的对应关系估计（例如，真实的最优对应），在输入图像发生形变时应保持不变。从形式上讲，该估计器应对所需的图像变换类具有等变性。在这项工作中，我们仔细分析了多步深度配准网络中的所需等变特性。基于这些分析，我们提出了一种新的等变概念：$[U,U]$等变性（网络对输入图像相同形变的等变性）和$[W,U]$等变性（其中输入图像可以经历不同的形变）；我们证明了在一个合适的多步配准设置下，如果第一步具有$[W,U]$等变性，而其余步骤具有$[U,U]$等变性，则整体上可实现$[W,U]$等变性；我们还表明，常见的位移预测网络仅表现出对平移的$[U,U]$等变性，而非更强大的$[W,U]$等变性；最后，我们展示了如何通过结合坐标注意力机制和位移预测细化层（CARL）实现多步$[W,U]$等变性。总体而言，我们的方法在多个三维医学图像配准任务中取得了优异的实际配准性能，并在腹部配准这一具有挑战性的问题上优于现有的无监督方法。

计算机视觉与模式识别

2025-04-02更新2024-05-27 发布

中子非弹性散射结果及其分析明确表明，在六方晶格钴酸盐BaCo$_2$(AsO$_4$)$_2$中存在主导的Kitaev相互作用。我们提出的各向异性交换模型能够很好地描述该材料磁场极化相中所有可用的中子散射数据。我们的模型在密度矩阵重正化群计算的结果与BaCo$_2$(AsO$_4$)$_2$中不寻常的双锯齿形磁有序以及较低的面内饱和场高度一致。

强关联电子体系

2025-04-02更新2025-03-26 发布

准确检测冒犯性语言对于社交媒体安全相关的多种应用至关重要。在这一任务中，低资源语言与高资源语言之间存在显著的性能差异。本文探索了之前未曾在僧伽罗语中用于冒犯性语言检测下游任务的微调策略，并由此引入了四种模型："Subasa-XLM-R"，它通过采用掩码释义预测的中间预微调步骤来增强性能；"Subasa-Llama" 和 "Subasa-Mistral" 的两个变体分别是基于 Llama（3.2 版）和 Mistral（v0.3 版）的特定任务策略微调版本。我们使用 SOLD 数据集对这些模型进行了评估，结果显示所有模型均优于现有基线模型。在零样本设置下，Subasa-XLM-R 在相同的 SOLD 数据集上的 Macro F1 得分达到 0.84，超过了包括 GPT-4o 在内的最先进大型语言模型。相关模型和代码已公开发布。

计算与语言

2025-04-02 发布

本文提出了一种针对Caputo分数阶传播子$S_\alpha(t)$以及与时间无关的扇形算子系数$A$的Cauchy问题的温和解的指数收敛数值方法，其中时间变量的Caputo分数阶导数的阶数为$\alpha \in (0,2)$。所提出的数值方法通过推广先前针对$S_\alpha(t)$构建的次序原则近似方法而得来。该技术能够消除误差估计主项对$\alpha$的依赖性，同时保留原近似方法的其他计算相关特性：支持多级并行性、处理初始数据时对空间光滑性的最低要求，以及对于所有$t \in [0, T]$的稳定指数收敛性。最终，次序原则的应用显著改善了方法的收敛行为，特别是在$\alpha < 0.5$的小值情况下，并为进一步提高数据重用效率提供了更多可能性。为了验证理论结果，我们考虑了所开发方法在直接问题（解的逼近）和反问题（分数阶识别）中的应用。

34A08, 34K37, 35R11, 35R20, 65L05, 65J08, 65J10, 65M32

2025-04-02更新2025-04-01 发布

铝磁体是一种新发现的反铁磁材料，其特征为独特的各向异性自旋分裂能带。由于其在信息存储与处理方面的巨大潜力，铝磁体引起了广泛关注。然而，测量由铝磁性引起的独特自旋分裂能带仍然是一项挑战。在此，我们提出利用库仑拖拽效应探测铝磁性。在库仑拖拽效应中，电子气体活性层中的电流传导可以因层间库仑相互作用而在邻近但隔离良好的被动层中诱导电流。我们发现，铝磁体中的库仑拖拽效应对自旋分裂费米面的方向高度敏感。因此，在无自旋轨道耦合作用的情况下，被动层中会出现横向电流拖拽现象，导致霍尔拖拽效应的发生，这一特性与以往的所有系统完全不同。更重要的是，铝磁体的所有拖拽效应都具有独特的角度依赖性，可以通过多端测量装置进行测量，以作为铝磁性的标志。这一研究提议将激发越来越多关于新兴磁性的探索。

介观与纳米尺度物理

2025-04-02更新2024-12-18 发布

当前的结构剪枝方法面临两个重要限制：(i) 它们通常将剪枝限制在更细粒度的层面，如通道层面，这使得激进的参数减少变得困难；(ii) 它们重点关注参数和FLOP的减少，现有的延迟感知方法常常依赖于简单且次优的线性模型，这些模型在Transformer中难以很好地泛化，因为在Transformer中多个相互作用的维度会影响延迟。本文通过引入多维剪枝（MDP）解决了这两个限制，MDP是一种新颖的方法，可以在多种剪枝粒度上联合优化，包括通道、查询、键、头、嵌入和块。MDP采用先进的延迟建模技术，准确捕捉所有可剪枝维度上的延迟变化，实现了延迟和准确率之间的最佳平衡。通过将剪枝重新表述为混合整数非线性规划（MINLP），MDP在满足延迟约束的同时高效地识别出所有可剪枝维度上的最优剪枝结构。这一通用框架支持CNN和Transformer。广泛的实验表明，MDP显著优于现有方法，尤其是在高剪枝比率的情况下。在ImageNet上，对于ResNet50剪枝任务，MDP比之前的HALP方法提升了28%的速度，并且Top-1准确率提高了1.4个百分点；与最新的Transformer剪枝方法Isomorphic相比，MDP额外提升了37%的速度，并且Top-1准确率提高了0.7个百分点。

考虑一般线性群 $\operatorname{GL}_{2}(K)$ 对多项式环 $K[X_{2 \times 2}]$ 的共轭作用。当 $K$ 为无限域时，不变环是生成元为迹和行列式的多项式环。我们描述了当 $K$ 为有限域时的不变环，并证明其为超曲面。我们还研究了其他经典子群以及对应于矩阵子空间（如迹零矩阵和对称矩阵）的多项式环。在每种情况下，我们都证明了不变环要么是多项式环，要么是超曲面。

交换代数

13A50

2025-04-02更新2025-01-25 发布

各类金融机构正在越来越多地采用大型语言模型（LLMs）以提升信用评估能力、提供个性化的客户咨询服务，并实现多种语言密集型流程的自动化。然而，有效部署LLMs需要妥善管理严格的数据治理需求、提高对可解释性的要求、承担伦理责任以及应对快速变化的监管环境。为解决这些挑战，我们提出了一套专门针对金融领域的结构化六步决策框架，引导组织从初步可行性评估系统性地过渡到最终的部署策略。该框架鼓励机构：（1）评估是否真的有必要引入先进的LLM；（2）制定健全的数据治理与隐私保护措施；（3）建立针对性的风险管理机制；（4）在开发过程中尽早融入伦理考量；（5）论证该项目的投资回报率（ROI）及其战略价值；之后才（6）选择最优的实施路径——开源还是专有、内部开发还是供应商支持，并确保其符合监管要求及运营实际。通过将战略考量与试点测试、保持全面审计跟踪以及持续合规评估等具体步骤相结合，此决策框架为负责任地利用LLMs提供了清晰的路线图。它并非僵化的、一刀切式的解决方案，而是展示了如何深思熟虑地将高级语言模型融入现有工作流之中——在推动创新的同时兼顾问责制，从而维护利益相关者的信任并保障监管完整性。

计算工程、金融与科学

2025-04-02 发布

共 13511 条搜索结果

共 13511 条

Ridge 杠杆得分采样用于 $\ell_p$ 子空间近似

磁性隧道结中的磁斯格明子：编织量子输运与微磁性

模拟海王星外天体霾层的氧化亚氮固态中红外成像光谱学

基于GPU求解大规模多商品网络流问题

Erlang-C模型有限时间行为的研究：混合时间、平均队列长度与尾界

LEACE: 完美线性概念擦除的闭式解

非局部方程解的连续对称化及唯一性

政治意见动态因果机制的研究：具有社区限定社会影响的分层粗粒化模型

透明、可解释且多模态（TIM）的增强现实个人助理的设计与实现

平行相似长度线段上的邻域旅行商问题的多项式时间近似方案

基于贝叶斯的协变量相关图学习与双组群尖峰-滑块先验

基于可见性图的模型预测控制在人形机器人路径规划与对抗对手追踪中的应用

CARL: 针对等变图像配准的框架

BaCo$_2$(AsO$_4$)$_2$: 果然是强Kitaev相互作用

Subasa——针对低资源环境下的僧伽罗语冒犯性语言检测适配语言模型

基于次序关系的Caputo分数阶传播子近似及其相关数值方法

铝磁体中的库仑拖拽效应

MDP：具有延迟约束的多维视觉模型剪枝

GL₂经典子群的多项式不变量：有限域上的共轭

负责任的创新：金融领域大型语言模型集成的战略框架