Research - arXiv

Research

arXiv

分类

近年来，现有异常检测基准（如MVTec AD和VisA）在分割AU-PRO指标上的性能已开始饱和，最先进的模型往往仅相差不到一个百分点。这种缺乏区分能力阻碍了对模型的有意义比较，从而阻碍了该领域的进步，尤其是考虑到机器学习结果固有的随机性时。我们推出了MVTec AD 2，这是一组包含八种异常检测场景的数据集，拥有超过8000张高分辨率图像。它包含了之前数据集中未考虑的具有挑战性和高度相关的工业检测用例，包括透明和重叠物体、暗场和背光照明、正常数据中存在高变异性以及极小缺陷的情况。我们对最先进的方法进行了全面评估，并表明其性能仍低于60%平均AU-PRO。此外，我们的数据集提供了光照条件变化的测试场景，用于评估方法在实际分布偏移下的鲁棒性。我们提供了一个公开可访问的评估服务器，其中包含测试集的像素精确地面真实标签（https://benchmark.mvtec.com/）。所有图像数据均可在https://www.mvtec.com/company/research/datasets/mvtec-ad-2获取。

计算机视觉与模式识别

2025-03-27 发布

本文提出了一种有理滤波器，用于计算实轴上位于某一区间内的对称正定特征值问题的所有特征值。嵌入子空间迭代框架中的滤波器所引起的线性系统通过预处理Krylov方法求解。滤波器极点的选择基于两个标准：一方面，滤波器应增强感兴趣的区间内的特征值，这表明极点应选择在区间附近或内部；另一方面，极点的选择对迭代方法的收敛速度有重要影响。对于来自振动问题的问题，这两个标准相互矛盾，因为特征值求解器的快速收敛需要极点位于或靠近区间，而当极点远离特征值时，迭代线性系统求解器变得更便宜。在本文中，我们提出了受Helmholtz方程移位Laplace预处理器启发的极点选择方案，并展示了来自有限元振动模型的数值实验。我们比较了移位Laplace有理滤波器与基于围线积分的高斯求积规则的有理滤波器。

2025-03-27 发布

我们研究了大型语言模型（LLMs）仅凭其内部知识生成全面且准确书评摘要的能力，而无需依赖原始文本。通过使用一组多样化的书籍和多种LLM架构，我们考察这些模型能否合成出与人类既定解释相一致的意义叙事。评估采用“LLM作为裁判”的范式：每个AI生成的摘要通过跨模型评估与高质量的人类撰写摘要进行比较，所有参与的LLM不仅评估自己的输出，还评估其他模型生成的内容。这种方法能够识别潜在的偏差，例如模型倾向于青睐自身摘要风格而非其他风格的倾向。此外，利用ROUGE和BERTScore指标量化人工制作与LLM生成摘要之间的对齐情况，评估语法和语义对应关系的深度。结果揭示了模型间在内容表达和风格偏好上的细微差异，凸显了依赖内部知识进行摘要任务时的优势和局限性。这些发现有助于更深入地理解LLM对事实信息的内部编码以及跨模型评估的动态变化，为开发更稳健的自然语言生成系统提供了启示。

计算与语言

2025-03-27 发布

微前端（Micro Frontend, MFE）架构因其促进独立性和模块化开发而广受欢迎。尽管其应用日益广泛，但该领域仍相对未被充分探索，尤其是在识别问题和记录最佳实践方面。本文基于已确立的微服务（Micro Service, MS）反模式以及对采用MFE的软件开发团队所面临的真实问题的分析，提出了一个包含12个MFE反模式的目录。我们通过识别MS反模式与MFE项目中反复出现的问题之间的相似性，将MS反模式映射并适应到MFE的上下文中，从而制定了目录的初始版本。为验证所识别的问题和提出的解决方案，我们对行业从业者进行了调查，收集了宝贵的反馈以完善反模式。此外，我们还询问参与者在实践中是否遇到这些问题，并让他们在10点李克特量表上评估其危害程度。调查结果显示，参与者在实际的MFE架构中遇到了所有提出的反模式，其中只有一个反模式的报告率低于50%。他们认为该目录可以成为新手和有经验的开发人员的宝贵指南，有助于提高MFE开发质量。收集的反馈促成了反模式目录的改进版本。此外，我们还开发了一个Web应用程序，不仅用于展示反模式，还积极促进MFE社区内的协作和参与。所提出的目录是识别和缓解MFE开发潜在问题的宝贵资源，使各级别的开发人员能够创建更健壮、可维护且设计良好的MFE应用程序。

2025-03-27更新2024-11-29 发布

$U(1)$ Dirac自旋液体可能实现一种奇特的物质相，其低能性质可以用$2+1$维量子电动力学描述，在其中无隙模态存在但自旋子与规范场强耦合。其存在性已在具有令人沮丧的超交换相互作用的受挫Heisenberg模型中通过自旋算符的(Abrikosov)费米子表示[X.-G. Wen, \href{https://doi.org/10.1103/PhysRevB.65.165113}{Phys. Rev. B {\bf 65}, 165113 (2002)}]提出，并辅以Gutzwiller投影。在这里，我们在具有最近邻($J_1$)和次近邻($J_2$)耦合的三角晶格Heisenberg模型中构建电荷-$Q$单极激发。在高度受挫的区域，电荷$Q=1$的单态和三重态单极子在热力学极限下变为无隙；此外，对于一般$Q$的能量与场论预测一致，这些预测是在大量无隙费米模式的情况下获得的。最后，我们考虑局域规范激发，在其中磁性$\pi$-通量集中在三角形plaquettes（类似于$\mathbb{Z}_2$ visons），表明此类状态在低能下并不起重要作用。我们的所有发现都支持三角晶格上的$J_1-J_2$ Heisenberg模型中存在稳定的$U(1)$ Dirac自旋液体。

强关联电子体系

2025-03-27更新2024-10-24 发布

光子学的发展被寄予厚望，有望重新定义神经形态数据处理的未来，尤其是在计算密集型的人工智能模型已成为我们日常生活不可避免的一部分的情况下。然而，在光子非线性激活函数领域仍有许多需要改进之处，因为可编程、全光、高能效的非线性特性仍然是当今最先进的技术难以触及的目标。本文针对这一问题提出了一种新颖的方法，用于实现高性能的全光光子激活。通过仿真和实验，我们发现法布里-珀罗激光二极管（FP-LD）对宽度低至25皮秒的输入光脉冲表现出丰富且高度可编程的非线性响应。我们展示了多种类似Sigmoid和反向PReLU的趋势，可用作光子神经网络中的全光激活函数，并在重复率高达10 GHz的严格实际训练场景中测试了其性能，随机数据模式下表现优异。通过多种实验操作参数证明了激活函数的可编程性，其中我们特别强调了额外注入FP-LD的连续波激光功率变化，为我们的方法增添了全光控制全光激活的功能。凭借主动元件非常低的静态功耗，我们实现了每非线性操作能量消耗低至皮焦耳到数百飞焦耳的纪录水平。

2025-03-27 发布

延迟问题是Chrome、Safari和Firefox等网页渲染引擎的主要关注点。这些引擎通过采用增量布局算法，在用户交互时重绘页面以减少延迟。在该算法中，帧间发生变化的元素被标记为脏节点；只需处理这些脏节点即可绘制下一帧，从而大幅降低延迟。然而，标准的增量布局算法必须遍历整个页面查找脏节点，过程中会访问大量辅助节点。这些辅助节点会导致缓存缺失和停顿周期增加，并占用了相当大的布局延迟比例。我们提出了一种新的、更快的增量布局算法——无脊布局。无脊布局采用计算成本更高的优先队列算法，避免了对辅助节点的访问，从而减少了缓存流量和停顿。这在悬停、输入或动画等最延迟敏感的交互中带来了显著加速。此外，由于进行了许多底层优化，我们使无脊布局在增量布局工作负载的整个频谱中具有竞争力。结果，在2216个基准测试中，无脊布局在78.2%的基准测试中更快，平均加速比为3.23倍，特别是在悬停、输入和动画等最延迟敏感的交互中表现尤为突出。

2025-03-27更新2024-11-16 发布

目标：我们旨在研究外科住院医师在机器人手术技能方面的长期获取情况，并探讨训练间隔和疲劳对表现的影响。方法：在六个月的时间内，外科住院医师每月参加三次训练课程，这些课程围绕一次持续26小时的医院轮班进行安排。在每次轮班期间，他们参与了在轮班前、轮班期间和轮班后安排的训练课程。在每次训练课程中，他们完成了三个干实验室训练任务：环塔转移、打结和缝合。我们收集了一个综合数据集，包括与运动学数据同步的视频、活动跟踪以及缝合垫的扫描结果。结果：我们收集了由18名不同外科专业住院医师完成的972次试验的数据集。参与者在所有任务中表现出一致的性能提升。此外，我们发现不同任务之间存在学习和遗忘的变化，并且提示可能存在疲劳的影响。结论：我们首次分析的结果揭示了具有延长间隔和不同程度疲劳的机器人手术技能长期学习过程的见解。意义：本研究为优化培训方案和增强手术中的人工智能应用奠定了基础，最终有助于改善患者预后。该数据集将在我们的期刊投稿被接受后公开。

2025-03-27 发布

相位约化是一种研究非线性振荡系统的重要技术。在特定假设下，它可以将每个多维振荡器简化为单一相变量，从而得到如Kuramoto模型这样的简单相位模型。经典方法主要应用于二体相互作用的情况下。然而，越来越多的证据表明，真实系统中的相互作用并非简单的二体相互作用，而是高阶（即多体）相互作用。尽管高阶系统中的同步现象已受到广泛关注，但由于其框架的高度非线性特性，解析结果较为稀缺。本文填补了这一空白，提出了高阶相互作用情形下的通用相位约化理论。我们证明了高阶拓扑结构在相位约化模型中可以被一阶保留，并且在某些对称性存在时，只有奇耦合会对动力学产生影响。此外，通过将该方法应用于具有全连接配置和环状超图拓扑的Stuart-Landau振荡器群体，我们展示了相位约化方法的强大性和灵活性；在这两种情况下，仅通过对相位模型的分析就能提供深刻的见解和解析结果。

适应和自组织系统

2025-03-27 发布

星系丝状结构在天文数据集中普遍存在。无论是粒子模拟还是观测数据，丝状结构总是作为研究系统平衡扰动的示踪体，蕴含了其历史及未来演化的关键信息。然而，在观测空间中，大量背景噪声和横向噪声的存在往往使这类结构的恢复变得复杂化。一般而言，背景噪声对分析具有破坏性，而横向噪声则可归因于测量误差，且可能包含关于结构的重要信息。此外，一维流形（丝状结构）通常是非线性的，其几何结构难以提取和建模。为了研究数据集中的隐藏流形，必须特别关注背景噪声去除和横向噪声建模，同时确保几何结构恢复的准确性。我们提出了1-DREAM：一个由五种主要机器学习方法组成的工具箱，旨在简化此类情况下的流形提取工作。每种方法均针对处理受噪声干扰的复杂低维结构的问题进行了设计，并已在先前发表的工作中经过广泛测试。本文详细介绍了这些方法，并在一个统一的框架下联合展示，同时应用于三个有趣的天文案例：模拟的章鱼星系、从宇宙网模拟中提取的丝状结构以及通过GAIA DR2观测到的Omega-半人马座恒星流。此外，还提出两种新的可视化技术，充分利用了1-DREAM所得结果的优势。代码已公开发布，供社区使用。在专门构建的数据集上的控制实验证明了该流程在恢复隐藏结构方面的准确性。

天体物理学仪器和方法

G.3; I.2; I.5; J.2

2025-03-27 发布

我们展示了关于量子图灵机（QTM）在严重受限内存下可解决的问题集的新结果。在此背景下，我们证明了“小空间”范围内的两个无限时间复杂度层次：对于任意$i\geq 0$，存在一个语言，可以由常量空间机器在$2^{O(n^{1/2^i})}$时间内识别，但不能被任何亚对数空间QTM在$2^{O(n^{1/2^{i+1}})}$时间内识别。对于运行于$o(\log \log n)$空间内的量子机器，还存在另一个层次结构，每个级别对应于不同正整数$i$的期望运行时间为$2^{O((\log n)^i)}$。此外，我们改进了一个量子优势结果，展示了一个语言，它可以由多项式时间常量空间QTM识别，但不能被任何经典机器在$o(\log \log n)$空间内识别，无论时间预算如何。文中讨论了这些发现对量子时空权衡的影响。

计算复杂性

2025-03-27 发布

十一维超引力存在一个非相对论变体，可通过与M2膜相关的极限获得。该非相对论超引力的一致性要求施加约束条件。存在一种约束选择方式可保持最大量的超对称变换，另一种仅能保留一半。本文基于M2和M5解的极限讨论了这一理论的超对称解。这些极限涉及布拉尼数量的缩放或在某些方向上的展宽，已被认为会产生出现在新型AdS/CFT对偶中的非洛伦兹几何。我证明缩放解是最大超对称版本的非相对论超引力的解，而展宽解仅给出半最大超对称版本的解。通过求解Killing旋量方程，我展示了这些解都是超对称的，并讨论了通常和非典型的超对称增强现象。我还讨论了一个简单的超对称AdS_3背景，并指出BTZ黑洞是非相对论11维超引力的解。

高能物理-理论

2025-03-27 发布

Glivenko-Cantelli定理是强大数定律的统一版本。它表明，对于任意独立同分布的随机变量序列，经验测度会收敛到其底层分布（以累积分布函数的一致收敛为意义）。在本文中，我们提供了研究类别概率中此类经验测度极限的工具。我们提出了两个公理，即排列不变性和经验充分性，这些公理应由类型为\(X^{\mathbb{N}} \to X\)的态射满足，以便将其解释为接受无限序列为输入并产生其经验测度样本输出的过程。由于并非所有序列都有明确的经验测度，“这类经验采样态射”存在于拟马尔可夫范畴中，与马尔可夫范畴不同，拟马尔可夫范畴允许部分态射。给定一个经验采样态射和其他一些性质后，我们证明了表征性以及Glivenko-Cantelli定理、强大数定律的抽象版本和de Finetti定理的抽象版本。我们通过标准Borel空间上的部分定义的马尔可夫核给出了多个经验采样态射的具体构造。实例化我们的抽象结果后，可以恢复有限一阶矩随机变量的标准Glivenko-Cantelli定理和强大数定律。因此，我们的工作从第一原理出发，联合证明了这两个定理与de Finetti定理。

计算机科学中的逻辑

统计学理论

Primary: 60A05, Secondary: 60F17, 62G30, 18M30, 18M05

2025-03-27 发布

长距离量子通信需要使用量子中继器，而量子中继器通常包括高相干性的量子存储器。我们对包含玻色纠错和存储组件的量子中继系统进行了理论分析，探讨其密钥生成率。具体而言，我们专注于二项式码在两个中继段的应用。通过这些码，我们的研究旨在抑制通常影响原子和微波腔等系统的存储丢失错误，而不是单自旋存储器中的退相错误。此外，我们进一步讨论了由微波腔和超导transmon组成的量子中继器的物理实现，该实现能够以高保真度（>97%）进行状态工程以及逻辑贝尔态测量，从而实现成功的纠缠交换。作为一种替代方法，我们也讨论了全光域中的实现方案。

2025-03-27 发布

在Darmon的重要文章中，他提出了一种通过全实域上的$\text{GL}_2$-型阿贝尔簇研究广义费马方程（GFE）的方案。迄今为止，只有某些Frey双曲曲线的雅可比簇被用于此目的。本文中，我们展示了大多数已知的Frey双曲曲线实际上是更一般的双参数双曲曲线族$C(z,s)$的特例。然后，我们应用聚类图方法计算了$C(z,s)$在所有奇素数处的导子。作为丢番图应用，我们将$C(z,s)$特殊化为某些特定值$z_0$和$s_0$，并找到了与$Ax^p+By^p=Cz^r$和$Ax^r+By^r=Cz^p$相关的自然Frey双曲曲线在奇素数处的导子指数，推广了Azor、Curc\'o-Iranzo、Khawaja、Maistret和Mocanu的结果，并为未来GFE系数的研究打开了大门。此外，我们展示了如何用这种方式构造一个新的$Ax^2+By^r=Cz^p$的Frey双曲曲线，从而对这一方程的导子指数给出新的结果。最后，遵循Golfieri和Pacetti最近的方法，我们通过超几何动机考虑了具有通用符号$(q,r,p)$的Frey表示，并利用$C(z,s)$计算了剩余表示模一个$p$上方的素数时，在$q$和$r$上方素数处的导子指数的野部分。

Primary 11D41. Secondary 11D61, 11G30, 11G20

2025-03-27 发布

考虑多群组数据的一致性低秩近似问题：我们寻求一组由 $k$ 个基向量组成的序列，使得将数据投影到这些基向量张成的子空间后，对所有群组的处理尽可能一致，即最小化各群组间最大误差。此外，我们要求该基向量序列满足自然的一致性属性：在寻找最佳 $k$ 个向量时，前 $d<k$ 个向量是求解找到 $d$ 个基向量问题的最佳解决方案。因此，这种多群组低秩近似方法自然推广了奇异值分解 (\svd)，并且对于单一群组的数据退化为 \svd。我们为此任务设计了一个迭代算法，该算法依次添加基于 min-max 准则的最佳秩-1 投影向量，并将数据投影到该向量的正交补空间。为了寻找最佳秩-1 投影，我们采用了对偶方法或半定规划。我们分析了算法的理论性质，并通过实证表明所提出的方法比现有的多群组（或公平）主成分分析 (PCA) 方法更具优势。

2025-03-27 发布

多细胞肿瘤球体（MCTS）是评估组合放（化）疗影响的先进细胞培养系统。它们从三维细胞-细胞和细胞-基质相互作用到与增殖活性和营养/氧气供应相关的径向病理生理梯度，表现出治疗相关的体内类似特性，从而改变细胞的放射敏感性。最先进的测定方法基于在每个照射剂量和治疗组中来自大量处理后的肿瘤球体的收集亮场图像时间序列，量化长期治愈终点。这里，根据Kaplan-Meier曲线记录了类似体内的肿瘤控制概率。这些分析需要对每种治疗组的多达100,000张图像进行繁琐的肿瘤球体分割，以从图像中提取相关结构信息，例如直径、面积、体积和圆形度。尽管有几种图像分析算法可用于肿瘤球体分割，但它们都专注于在整个生长过程中具有明显外缘的紧凑型MCTS。然而，处理后的MCTS可能部分脱落和破坏，并且通常被死细胞碎片遮挡。我们成功训练了两种全卷积网络，UNet和HRNet，并优化其超参数，以开发用于未处理和处理后的MCTS的自动分割方法。我们在来自两个人类头颈部癌细胞系的更大独立数据集上系统地验证了自动分割。我们发现大多数图像的手动和自动分割之间具有极好的重叠，通过约90%的Jaccard指数量化。对于分割重叠较小的图像，我们证明这种误差与不同生物专家之间的分割变化相当，这表明这些图像是生物学上不清楚或模糊的情况。

计算机视觉与模式识别

组织与器官

2025-03-27更新2024-05-02 发布

大型语言模型（LLMs）在代码任务中的依赖程度日益增加，但在大多数情况下，都假设所有相关信息要么可以在上下文中访问，要么与训练数据匹配。我们认为，LLMs可以从交互式探索代码库以获取与其任务相关的信息的能力中受益。为实现这一目标，我们提出了一种文本环境，即debug-gym，用于在交互式编码环境中开发基于LLM的代理。我们的环境轻量级且提供一组有用的工具，例如Python调试器（pdb），旨在促进基于LLM的代理的交互式调试。除了编码和调试任务外，这种方法还可以推广到其他任务，这些任务将从LLM代理的信息寻求行为中受益。

计算与语言

2025-03-27 发布

在利用多个扩散模型进行协同生成方面已有诸多尝试，其应用领域已超越原始领域。一种突出的方法是通过混合估计的得分来同步多个扩散轨迹，从而人为地关联生成过程。然而，现有方法依赖于简单的启发式方法（例如平均值），而未考虑任务的特异性。这些方法未能阐明此类方法为何有效，并且在将适合某一任务的启发式盲目应用于其他任务时往往失败。本文提出了一种概率框架，用于分析扩散同步为何有效，并揭示了启发式方法应关注的方向——即建模多个轨迹之间的相关性并针对每个特定任务进行调整。此外，我们进一步为每项任务识别出最优的相关性模型，实现了比以往跨所有任务采用单一启发式的更优结果，而无需任何解释。

计算机视觉与模式识别

计算机图形学

2025-03-27 发布

菲利普·赖特（Wright, 1928）探讨了油类和黄油的需求与供给问题。在该书附录B中，菲利普·赖特对因果推断做出了若干开创性的贡献。他引入了供需结构方程模型，通过矩方法和有向无环图确立了供需弹性的识别方法，开发了利用天气条件作为工具变量估计需求弹性的经验方法，并提出了对加征关税和税收福利效应进行反事实分析的方法。此外，他还运用这些方法对数据进行了实证研究。这些思想远超当时统计学或计量经济学领域关于因果推断的理论与经验发展。本文旨在以现代框架重新呈现P.赖特的工作，采用讲义形式以便于教学并联系当代研究。

计量经济学

2025-03-27更新2025-01-26 发布

共 13511 条搜索结果

共 13511 条