Research

arXiv

分类

在本文中，我们提出了一种适用于一般双带玻色超流体的双对易子方法。首先，我们证明了超流体密度与正常流体密度之和等于f-求和规则的权重，该权重可以通过分析基态波函数轻松确定。一旦我们确定了上带的激发能隙，就可以通过计算速度算符与哈密顿量之间的双对易子平均值来得到正常流体密度。作为此方法的应用，我们研究了平带玻色-爱因斯坦凝聚体（BEC）的超流密度。利用Bogoliubov方法，我们计算了声速和激发能隙，从而可以明确地得到正常流体密度和超流密度。我们的研究结果表明，超流密度正比于声速平方与压缩率的乘积。此外，平带BEC中非零超流密度的存在依赖于相互作用的形式。例如，在U(2)不变相互作用的情况下，超流密度为零。我们还观察到，对于小相互作用，超流密度正比于相互作用参数与量子度规的乘积。双对易子方法表明，相互作用对激发能隙的修正是平带BEC产生非零超流密度的原因。在平带BEC的线性相互作用参数范围内，激发能隙、正常流体密度和超流密度的所有结果也可以通过简单的微扰理论获得。我们的工作为理解平带BEC的超流行为提供了另一种独特的视角。

量子气体

超导

量子物理

2025-04-01更新2025-03-31 发布

大型语言模型（LLMs）越来越多地被用作知识获取的工具，但用户无法有效指定他们希望信息如何呈现。当用户请求LLMs“引用可信来源”、“表达适当的不确定性”或“包含多个视角”时，他们发现当前界面没有结构化的方式来表达这些偏好。结果便是提示共享的民间传说：社区特定的复制提示通过信任关系传播，而非基于实际效果。我们提出了知识对齐框架，这是从认识论哲学文献中衍生出的一组十个知识传递挑战，涉及证据质量评估和证词依赖校准等问题。该框架作为用户需求与系统能力之间的结构化中介，创建了一种通用词汇，以弥合用户想要的内容与系统交付内容之间的差距。通过对在线社区中共享的定制提示和个人化策略进行主题分析，我们发现用户开发了复杂的解决方法来应对每一项挑战。然后，我们通过对其已记录政策和产品功能的内容分析，将我们的框架应用于两个主要的模型提供商——OpenAI和Anthropic。我们的分析表明，尽管这些提供商部分解决了我们所识别的挑战，但他们未能建立足够的机制来指定认识论偏好，缺乏关于如何实现偏好的透明度，并且没有提供任何验证工具来确认是否遵循了偏好。对于AI开发者而言，知识对齐框架为支持多样化知识传递方法提供了具体的指导；对于用户而言，它致力于实现与他们具体需求相一致的信息传递，而不是默认采用一刀切的方法。

我们提出了一种全局可解释性方法，用于分析我们基于真实世界多任务卷积神经网络（MTCNN）的深度弃权分类器（DAC）在癌症病理报告自动标注任务中的组织学预测错误来源。我们的分类器在104万份手工标注样本上进行了训练和评估，能够同时对每份报告预测癌症部位、亚部位、组织学类型、侧别及行为特征。DAC框架允许模型在模棱两可的报告或混淆类别上选择弃权，以达到保留样本（未弃权样本）的目标准确率，但代价是覆盖范围降低。要求组织学任务达到97%准确率时，我们的模型仅保留了22%的样本，主要为较不模糊且常见的类别。通过GradInp技术进行局部可解释性分析，提供了高效获取数千个个体预测上下文推理的方法。我们的方法通过对约13000个局部解释进行降维处理，实现了对错误来源的全局识别，包括类别间的层次复杂性、标签噪声、信息不足以及冲突证据等问题。这表明可以通过排除标准、聚焦标注以及对涉及层次相关类别的错误减少惩罚等策略，迭代改进我们在这一复杂实际应用中的DAC模型。

机器学习

2025-04-01 发布

我们研究了寻找正整数 $ n $ 的问题，使得 $ 2^n $ 的所有十进制数字均为偶数（即属于 $\{0, 2, 4, 6, 8\}$）。通过计算验证到 $ n = 10^{13} $，已知的情况为 $ n = 1, 2, 3, 6, 11 $，未发现其他实例。我们基于等分布性和缩小目标的方法提出了一种自洽的论证，表明仅有有限多个正整数 $ n $，使得 $ 2^n $ 的所有十进制数字均为偶数。

数论

动力系统

2025-04-01更新2025-03-29 发布

全球范围内的脉冲星测时阵列（PTA）实验在PTA数据集中揭示了支持现有引力波背景（GWB）信号的证据。除了获取更多观测数据外，通过改进噪声建模的准确性也可以提高PTA实验的灵敏度。在PTA数据分析中，噪声建模主要采用贝叶斯统计方法，依赖边缘似然和贝叶斯因子来评估证据。我们引入广义步进采样（GSS）作为PTA-贝叶斯框架中一种高效且准确的边缘似然估计方法。该方法能够以低成本获得高精度估计，特别是在比较昂贵的模型（如Hellings-Downs（HD）模型或重叠归一化函数模型（ORF））时。我们通过重新评估北美纳米赫兹引力波天文台（NANOGrav）15年数据集和欧洲PTA（EPTA）第二数据发布的结果，展示了GSS在模型选择和证据计算中的效率和准确性。我们发现与NANOGrav 15年数据集报告的结果相比，GWB的证据相似；与EPTA第二数据发布的证据相比，我们在所有数据集中发现了显著增加的GWB支持证据。

天体物理学仪器和方法

2025-04-01更新2024-11-22 发布

深度学习理论中的一个核心问题是理解神经网络如何学习分层特征。深度网络提取显著特征的能力不仅对其卓越的泛化能力至关重要，也是现代深度学习预训练和微调范式的基础。然而，从理论角度而言，这一特征学习过程仍未被充分理解，现有分析大多局限于两层网络。在本文中，我们证明了三层神经网络相较于两层网络具有更丰富的特征学习能力。我们分析了通过逐层梯度下降训练的三层网络所学习到的特征，并提出了一般性的定理，该定理界定了当目标函数具有特定分层结构时，达到低测试误差所需的样本复杂度和宽度上限。我们将此框架应用于具体统计学习场景——单指标模型以及二次特征的函数，并证明在后一种情况下，三层网络相较于所有已知的两层网络保证方法在样本复杂度上有所改进。这一改进的关键在于三层网络能够高效地学习非线性特征。随后，我们通过构造一个可通过三层网络上的梯度下降有效学习但无法被两层网络有效学习的函数，建立了具体的优化深度分离结果。我们的工作在理解三层神经网络相对于两层网络在特征学习方面的理论优势方面取得了进展。

机器学习

2025-04-01更新2023-05-11 发布

本文证明了具有形如$H=-\Delta+i(A \nabla + \nabla A) + V$的哈密顿量的Schrödinger方程（包含磁位势$A$）具有与自由Schrödinger方程相同的色散性和解的衰减性质。特别地，我们证明了$H$的$L^1 \to L^\infty$衰减性和波方程的一些相关估计。位势$A$和$V$为短程位势，且$A$具有四个导数，但它们可以任意大。所有结果均在三维空间中成立。

PDE分析

数学物理

2025-04-01更新2024-11-18 发布

图$G=(V,E)$的$d$维代数连通性$a_d(G)$是其$d$维刚性的定量度量，定义为与将图嵌入$\mathbb{R}^d$相关的刚度矩阵的特征值。对于函数$a:V\to \mathbb{N}$，我们记$G^{(a)}$为$G$的$a$-扩张图，即通过将每个顶点$v\in V$替换为大小为$a(v)$的独立集所得到的图。我们确定了$G^{(a)}$的刚度矩阵特征值与其原始图$G$的某些加权刚度矩阵特征值之间的关系。这解决了Lew、Nevo、Peled和Raz关于完全图平衡扩张的刚度特征值的一个猜想。作为应用，我们得到了完全二分图的$d$维代数连通性的下界。更具体地，我们证明如下：设$K_{n,m}$为具有大小分别为$n$和$m$两边的完全二分图。则对于每个$d\geq 1$，存在$c_d>0$，使得对于所有$n,m\geq d+1$且$n+m\geq \binom{d+2}{2}$，有$a_d(K_{n,m})\geq c_d\cdot \min\{n,m\}$。该界至多相差一个乘法常数。在特殊情况下$d=2$，$n=m=3$时，我们得到改进的界$a_2(K_{3,3})\geq 2(1-\lambda)$，其中$\lambda\approx 0.6903845$是多项式$176x^4-200x^3+47x^2+18x-9$的唯一正实根，我们推测此界为紧界。

组合学

2025-04-01 发布

来自人类反馈的强化学习（RLHF）使机器学习系统能够从人类反馈中学习目标。这些系统的一个核心限制在于其假设所有反馈都来自单一的人类教师，尽管实际上可能会询问多个不同的教师。我们提出了隐藏效用多臂老虎机（HUB）框架来建模教师在理性、专业性和成本方面的差异，从而形式化了从多个教师学习的问题。我们开发了多种解决方案算法，并将其应用于两个现实世界的应用领域：论文推荐系统和COVID-19疫苗测试。研究发现，主动教师选择（ATS）算法通过主动选择何时以及向哪个教师查询，优于基线算法。HUB框架和ATS算法展示了利用教师之间的差异来学习准确奖励模型的重要性，为未来关于鲁棒奖励建模的主动教师选择研究奠定了基础。

人工智能

机器学习

2025-04-01更新2023-10-23 发布

在训练数据有限的情况下，尤其是对于复杂查询的有效信息检索（IR）任务，仍然是一个具有挑战性的难题。本文提出了一种名为IR2（Information Regularization for Information Retrieval）的信息规则化技术，用于在合成数据生成过程中减少过拟合现象。这种方法代表了正则化技术在信息检索合成数据创建中的新颖应用，并在三个具有复杂查询的近期信息检索任务（DORIS-MAE、ArguAna 和 WhatsThatBook）中进行了测试。实验结果表明，所提出的正则化技术不仅在所考虑的任务上优于先前的合成查询生成方法，而且将成本降低了多达50%。此外，本文在查询合成管道的不同阶段（输入、提示和输出）对三种正则化方法进行了分类和探索，与未应用正则化的模型相比，这些方法提供了不同程度的性能改进。这为在数据受限且查询复杂的IR场景中优化合成数据生成提供了一种系统性方法。所有代码、提示和合成数据均可在https://github.com/Info-Regularization/Information-Regularization获取。

2025-04-01更新2024-02-25 发布

水库计算是一种机器学习形式，它利用非线性动态系统以比典型神经网络更具成本效益的方式执行复杂任务。近期在水库计算领域的许多进展，特别是量子水库计算，主要依赖于固有随机的水库。然而，使用这些系统的理论依据尚未得到充分确立。本文研究了随机水库计算机的通用性，在其中我们使用随机系统进行水库计算，并以每个水库状态的概率作为读出值而非状态本身。在随机水库计算中，整个水库计算机的状态数量可能随水库硬件规模呈指数级增长，从而提供紧凑设备尺寸的优势。我们证明了随机回声状态网络的类别，因此所有随机水库计算机的类别，都是通用近似类。我们还研究了两种实际随机水库计算机示例在分类和混沌时间序列预测中的性能。虽然散粒噪声是随机水库计算性能的一个限制因素，但在噪声影响较小的情况下，我们展示了其相较于具有相似硬件的确定性水库计算机的显著性能提升。

2025-04-01更新2024-05-20 发布

我们研究了在缓慢滚动物理膨胀后的再加热时期，由非最小耦合于曲率标量$\mathcal{R}$的膨胀场$\varphi$驱动产生的非热费米子暗物质粒子。考虑了两种类型的非最小耦合：自然（称为NM-N）和Coleman-Weinberg（称为NM-CW）膨胀中的$\xi\varphi^2\cal{R}$，以及仅在自然膨胀中出现的$\alpha\left(1+\cos(\frac{\varphi}{f_a})\right)$（称为NMP-N），其中$\alpha$和$\xi$是无量纲参数，$f_a$是能量尺度。我们确定了满足当前宇宙微波背景（CMB）辐射测量限制的缓慢滚动膨胀场景的基准值，并发现三种膨胀场景下的膨胀场质量为$m_\phi\sim {\cal O}\left(10^{12}\right) \text{GeV}$，张量-标量比$r\sim 0.0177$（对于NM-N），$\sim 0.0097$（对于NMP-N），以及$r\sim 0.0157$（对于NM-CW），这些值落在Planck2018+BICEP3+KeckArray2018联合分析的标量谱指数与$r$平面的$1-\sigma$轮廓内，并且可以通过未来的CMB观测（如Simons Observatory）进行探测。然后我们表明，如果膨胀场与暗物质之间的耦合强度$y_\chi$和暗物质的质量$m_\chi$分别在NM-N和NMP-N范围内（对于NM-CW），则由膨胀场衰变产生的暗物质粒子可以完全匹配目前冷暗物质（CDM）的产量以及其他宇宙学约束，具体范围为$10^{-1}\gtrsim y_\chi\gtrsim 10^{-20}$（对于NM-N和NMP-N）以及$10^{-4}\gtrsim y_\chi\gtrsim 10^{-20}$（对于NM-CW），并且${\cal O}\left(\text{keV}\right)\lesssim m_\chi\lesssim m_\phi/2$（对于NM-N、NMP-N和NM-CW）。$y_\chi$和$m_\chi$的具体范围随着不同的基准值以及膨胀参数（如膨胀能标和$r$）而变化，其中一些值可能在下一代CMB实验的探测范围内。

高能物理-唯象学

宇宙学和非星系天体物理学

2025-04-01更新2023-06-14 发布

我们系统研究了在时空中自由运动的中性粒子的自旋进动现象。首先，我们推导出描述一般静态轴对称时空内自旋进动的公式。然后，我们将此公式应用于研究在文献中最常见的各类时空中自由运动的中性自旋粒子的自旋进动。我们的结果被用来提取中微子在这些选定时空中的螺旋性翻转概率。结果表明，低能中微子在所考虑的所有时空中都具有接近于1的自旋翻转概率。然而，值得注意的是，虽然高能中微子在大多数这些时空中自旋翻转概率仍然不显著，但其中一些时空中高能中微子的自旋翻转概率也可以达到1。

高能物理-唯象学

广义相对论与量子宇宙学

2025-04-01更新2025-02-21 发布

银河团热气体的温度被证明是其总引力质量的一个可靠代理，这使得利用光谱X射线观测可以用于测量晕的质量函数。然而，由于星系团内介质（ICM）未解析的（多温）内部结构、投影效应以及为了进行稳健的光谱拟合而需要做出某些模型假设，浅层大面积巡天的数据往往排除了直接拟合X射线能谱的可能性。我们考虑使用一个简单的可观测值——观测到的星系团X射线谱的平均能量——作为ICM温度的非模型依赖代理，并由此推断星系团的质量。我们使用从宇宙磁性模拟（\textit{Magneticum}）大尺度流体动力学模拟中提取的84个质量较大的星系团样本，校准了这一代理与星系团参数的关系。我们考虑了与\textit{SRG/eROSITA}全天空巡天观测相对应的观测参数。考虑到各种背景和前景信号的贡献，在0.4至7.0 keV能段内，模拟的X射线谱的平均能量被证明是ICM温度的稳定指示器，其散度约为10%，并且是星系团质量$M_{500}$的稳定指示器，其散度约为20%。包含模拟X射线图像及其光谱（在几个同心环内减去背景）的数据库是公开可获取的。

宇宙学和非星系天体物理学

高能天体物理现象

2025-04-01更新2024-08-21 发布

虽然机器学习（ML）仍然是一个相对较新的研究领域，尤其是在抽象数学和计算机科学之外，关于大型语言模型（LLMs）的政治方面的研究工作很少，特别是关于对齐过程及其政治维度的研究更为有限。这一过程可能简单如提示工程，但也非常复杂，且可能影响完全不相关的问题。例如，有政治导向的对齐过程对LLMs的嵌入空间以及此类空间中政治概念的相对位置具有很强的影响。通过使用特殊工具评估总体政治偏见并分析对齐的影响，我们可以收集新数据以了解其原因及其对社会的潜在后果。实际上，通过采取社会政治视角，我们可以假设大多数大型LLMs都与马克思主义哲学所说的“占主导地位的思想体系”保持一致。由于人工智能在政治决策中的作用——无论是对公民层面还是政府机构层面而言，这种偏见可能会对社会变革产生巨大影响，要么通过创造新的、隐晦的社会一致性路径，要么通过允许伪装的极端主义观点在人群中传播。

计算机与社会

人工智能

2025-04-01更新2024-09-13 发布

视觉-语言模型（VLMs）的发展依赖于大规模且多样化的多模态数据集。然而，由于缺乏公开可用的注释数据集，特别是在生物学和医学领域，通用型生物医学VLMs的发展受到限制。现有的努力局限于狭窄的领域，未能涵盖科学文献中编码的全部生物医学知识多样性。为解决这一问题，我们推出了BIOMEDICA，这是一个可扩展的开源框架，用于提取、注释并序列化PubMed Central开放获取子集的所有内容，形成易于使用且公开可访问的数据集。我们的框架生成了一个包含超过2400万个独特图像-文本对的全面档案，来源于超过600万篇文章。此外还提供了元数据和专家指导的注释。我们通过发布BMCA-CLIP展示了该资源的实用性和易用性，这是一套通过流式处理在BIOMEDICA数据集上连续预训练的CLIP风格模型，无需下载27TB的数据即可使用。平均而言，我们的模型在涵盖病理学、放射学、眼科学、皮肤病学、外科学、分子生物学、寄生虫学和细胞生物学等领域的40项任务中实现了最先进的性能，在零样本分类任务中平均提升了6.56%（在皮肤病学和眼科学中分别高达29.8%和17.5%），并且在图像-文本检索方面表现更强，同时使用的计算资源仅为常规方法的十分之一。为了促进可重复性和协作，我们将代码库和数据集向更广泛的科研社区开放。

计算机视觉与模式识别

计算与语言

2025-04-01更新2025-01-13 发布

尽管生物医学人工智能（AI）领域充满热情，但高质量、多样化和大规模的数据——现代AI系统的基础，仍然是充分发挥其潜力的一个瓶颈。为了解决这一差距，我们引入了Biomedica，这是一个来源于PubMed Central开放获取子集的开源数据集，包含超过600万篇科学文章和2400万对图像-文本，以及27个元数据字段（包括专家人工标注）。为了克服访问我们大规模数据集的挑战，我们通过网络服务器提供了可扩展的流式传输和搜索API，便于与AI系统无缝集成。我们通过构建嵌入模型、聊天风格模型和检索增强型聊天代理，展示了Biomedica数据集的实用性。值得注意的是，在各自的类别中，我们的所有AI模型都超过了以往的开源系统，突显了多样化、高质量和大规模生物医学数据的关键作用。

计算与语言

机器学习

2025-04-01更新2025-03-26 发布

我们在宇宙早期对称相的基于质量表象的极小扩展标准模型中展示了CP破坏的CKM和PMNS矩阵不仅出现在弱相互作用中，也出现在Yukawa相互作用中。这是由于Higgs场的四个分量的存在，导致了费米子味守恒的破缺，这种现象在破缺相中不存在。具体来说，左手费米子获得了涉及CKM和PMNS矩阵元绝对值的额外热质量贡献。最显著的是，Yukawa相互作用的结构使得左手费米子之间发生味改变和CP破坏的跃迁成为可能，例如$u_L\leftrightarrow c_L$，而在破缺相中此类跃迁不会发生。相比之下，右手费米子保持其质量本征态，导致不同的热质量。此外，我们还识别出新颖的CP破坏散射过程，如$u_L\bar{c}_L\rightarrow 2A_3$，这些过程仅存在于对称相中。

高能物理-唯象学

2025-04-01 发布

设$P_n$为对称群$S_n$的一个Sylow $p$-子群。我们研究了$P_n\setminus S_n\ /\ P_n$双陪集的数量与大小，结果表明当$p$为奇数时（或等价地，当$n$较大时$x\in S_n$），大多数双陪集具有最大尺寸，即$P_n\cap P_n^x=1$。我们还发现，除了一个小例外列表外，所有可能的此类双陪集的尺寸都会出现。

群论

2025-04-01 发布

利用边界积分方程方法可以高效计算界面Stokes流动。在三维情况下，目标点处的流体速度由对所有界面的二维表面积分给出，从而降低了问题的维度。一个核心挑战是，当目标点靠近但不在界面时，表面积分是近奇异的，标准的数值积分方法会失去精度。本文提出了一种方法，能够准确计算三维椭圆边值问题中出现的近奇异积分。该方法基于通过目标点在表面上的正交投影得到的基点处对被积函数的局部级数展开式。由此得到的级数展开式中的初等函数可以在基点附近的区域内利用递归算法实现高精度积分。剩余的积分则使用标准的数值积分规则进行计算，这里选择的是4阶梯形法则。该方法可简化为标准积分加上修正项，并且在整个范围内保持4阶精度。该方法被应用于解决几个椭球刚体周围的Stokes流动。我们比较了在刚体附近的速度误差，以及在有无修正的情况下计算的粒子围绕刚体运动的时间和位移误差。

共 13511 条搜索结果

共 13511 条

双对易子方法研究双带玻色-爱因斯坦凝聚体：平带超流体的超流密度

知识对齐：用户与大型语言模型知识传递的中介框架

深度弃权分类器的全局可解释性研究

仅含偶数位的二的幂的有限性

广义步进采样：脉冲星测时阵列引力波分析中的高效边缘似然估计

三层神经网络非线性特征学习的理论保证

三维空间中含磁位势的Schrödinger方程的衰减估计

图扩张的刚度矩阵与完全二分图的$d$维代数连通性

基于人类反馈的强化学习中主动教师选择的研究

信息检索中的信息规则化技术：IR2

随机水库计算机

涨后粒子暗物质的产生：非最小自然和Coleman--Weinberg膨胀场景

各类时空中的自旋进动与中微子螺旋性翻转

银河团X射线谱平均能量作为非模型依赖质量代理的模型

宣传就是你需要的一切

BIOMEDICA：一个开源的生物医学图像-标题档案、数据集及从科学文献衍生的视觉-语言模型

来源于开放科学文献的大规模视觉-语言数据集推动生物医学通用人工智能的发展

宇宙早期热费米子传播子及通过环修正引起的味改变

关于对称群Sylow子群双陪集的数量与大小

修正的梯形法则用于近奇异表面积分在三维界面Stokes流中的应用