分类

作为SAT的CNOT最优Clifford综合

Clifford电路优化是量子编译流水线中的重要步骤。主要的编译器采用启发式方法。虽然它们速度快,但结果往往是次优的。减少噪声门(如两量子比特CNOT门)的数量对实际计算至关重要。已有精确方法填补了启发式方法留下的空白。其中一种基于SAT的方法可以优化门数量或深度,但存在可扩展性问题。此外,这些方法在更重要的指标(如CNOT数量或CNOT深度)上无法保证最优性。近期的一项工作提出了一种仅针对特定正规形式Clifford电路的穷尽搜索方法,以保证CNOT数量最优性。但由于穷尽方法的限制,该方法无法扩展到超过6个量子比特。本文中,我们将正规形式Clifford电路的搜索整合到SAT编码中,以保证CNOT数量最优性。通过允许并行计划,我们提出了第二种SAT编码以优化CNOT深度。利用SAT方法的灵活性,我们还处理硬件平台的连接限制,并允许量子比特重新标记。我们在开源工具Q-Synth中实现了上述编码及其变体。实验结果显示,我们的编码在随机Clifford电路上的表现显著优于现有SAT方法。我们使用实用的VQE和Feynman基准测试与TKET和Qiskit编译器进行比较。在全互连条件下,我们观察到CNOT数量减少了高达32.1%,CNOT深度减少了高达48.1%。总体而言,我们在CNOT数量和深度方面优于TKET的结果。我们还研究了主要量子平台的连接限制。与Qiskit相比,我们观察到CNOT数量进一步减少了高达30.3%,CNOT深度减少了高达35.9%。

量子物理
人工智能
2025-04-01 发布

高性能计算系统中不确定性量化工作流任务调度的性能分析

不确定性量化(UQ)工作负载在科学和工程领域变得越来越普遍。它们涉及提交成千上万甚至数百万个相似的任务,这些任务可能具有不可预测的运行时间,并且总任务数量通常事先未知。静态的“一刀切”批处理脚本可能会导致次优调度,而安装在高性能计算(HPC)系统(如SLURM)上的原生调度器往往难以高效地处理此类工作负载。本文介绍了一种适用于UQ工作流的新负载均衡方法。为了在实际环境中展示其效率,我们重点关注GS2旋量等离子体湍流模拟器。单个模拟可能计算需求较高,运行时间因高维输入参数而显著变化——从几分钟到几小时不等。我们的方法结合了UQ和建模桥(提供与仿真模型无关的语言接口),以及HyperQueue(与原生调度器协同工作)。特别地,部署此框架于HPC系统时无需进行系统级更改。我们将所提出的框架与独立的SLURM方法及基于GS2及其高斯过程代理的SLURM方法进行了基准测试。结果表明,与朴素的SLURM方法相比,我们的方法可以将调度开销减少多达三个数量级,并使长运行模拟的CPU时间减少高达38%,同时不对UQ工作流固有的作业提交模式做出任何假设。

分布式、并行与集群计算
2025-04-01更新2025-03-28 发布

中子星潮汐效应是否掩盖了广义相对论的偏差?

引力波天体物理学的主要目标之一是研究强场条件下的引力,并限制对广义相对论(GR)的偏离。任何这样的偏离不仅影响双星的动力学和引力波发射,还影响致密天体的结构和潮汐特性。对于中子星而言,质量、半径和潮汐变形量在不同引力理论中可能有显著差异。目前,中子星半径和潮汐变形量的测量不确定性仍然较大。然而,人们对核物质状态方程(EOS)的大不确定性如何影响利用双中子星并合事件检验广义相对论的认识还很有限。相反,使用错误的引力理论可能导致对核物质状态方程的约束不准确。在这里,我们在标量-张量(ST)理论框架下研究了这一问题。我们应用该理论最近推导出的$\ell = 2$潮汐洛夫数来估计GW170817参数,并测试超出广义相对论的物理是否会导致核物质状态方程和中子星半径测量的偏差。我们发现,广义相对论和标量-张量理论下的参数推断结果在双星质量和潮汐变形量上一致,但半径和状态方程后验分布在这两种理论下有所不同,且当前观测限制并未排除这两种理论。这表明核物质状态方程的测量可能存在偏差,而当前双中子星并合事件的分析可能无法检测到广义相对论的偏离。

广义相对论与量子宇宙学
高能天体物理现象
2025-04-01更新2024-11-28 发布

所有次终端概形

我们通过刻画其点集结构、茎层以及拓扑,对所有次终端概形进行了分类。这推广了我们之前对次终端仿射概形的分类,后者对应于固体环的谱。

代数几何
2025-04-01 发布

高优先级随机协同流调度性能界限

我们考虑了非clairvoyant设置下的协同流调度问题,假设流大小在线根据给定的概率分布实现。目标是在期望下最小化协同流的加权平均完成时间。我们首先为该问题获得适用于所有非预测性基于顺序的速率分配策略的不等式,并定义此类调度策略性能空间的多面体松弛。利用这种松弛来分析一种简单优先级策略的性能,其中优先级顺序由Sincronia根据预期流大小而非未知实际值计算得出。我们针对任意流大小概率分布(具有有限的一阶和二阶矩)建立了该优先级策略相对于最优优先级策略的近似比界。对于某些特定分布,获得了更紧的上界。广泛的数值结果表明,所提出策略的性能远优于该界。

分布式、并行与集群计算
2025-04-01 发布

基于Choquet积分的特征子集加权在距离驱动监督学习中的应用

本文提出了一种基于单调测度的特征子集加权方法应用于距离驱动的监督学习中。通过Choquet积分定义了一种包含这些权重的距离度量。这种集成使得所提出的距离能够有效地捕捉非线性关系,并考虑条件属性与决策属性之间以及条件属性之间的相互作用,从而实现更灵活的距离度量。特别地,我们展示了这种方法如何确保距离不受重复特征和强相关特征添加的影响。该方法的另一个关键点是它使特征子集加权在计算上可行,因为每次只需计算$m$个特征子集权重,而不是计算所有特征子集权重($2^m$),其中$m$为属性数量。此外,我们还研究了使用Choquet积分测量相似性导致的距离定义的非等价性,并通过对偶测度进一步探讨了距离与相似性之间的关系。同时,提出了保持相似性与距离经典对称性的对称Choquet距离和相似性。最后,我们引入了一个具体的特征子集加权距离,并在$k$-最近邻(KNN)分类设置下评估其性能,与Mahalanobis距离和加权距离方法进行了比较。

机器学习
人工智能
2025-04-01 发布

基于光互连的高度可扩展LLM集群

我们提出了LumosCore,用于为LLM任务构建高带宽和大规模数据中心网络。通过用光路交换机取代核心层的电气数据包交换机,LumosCore可以实现带宽提升至原来的2倍或网络规模扩大至原来的8倍。我们详细设计了LumosCore在部署阶段和运行阶段的具体方案。在部署阶段,我们提出了交错布线方案,该方案兼容所有可能的逻辑拓扑结构。在运行阶段,我们设计了多项式时间算法,用于GPU放置、逻辑拓扑生成和OCS重构,以最小化网络拥塞并减少对已调度任务的影响。我们通过测试床实验和大规模仿真评估了LumosCore。与传统的混合光电架构相比,在128节点测试床上,LumosCore使端到端训练吞吐量提升了高达39.5%。与最先进的Clos架构相比,在16k规模仿真平台上,LumosCore使平均作业完成时间减少了高达34.1%。

网络与互联网体系结构
2025-04-01更新2024-11-03 发布

减少变分量子算法导数成本的新方法

我们提出了一种名为量子非破坏测量(Quantum Non-Demolition Measurement, QNDM)的替代方法,并对其进行了详细的数值研究,以高效估计量子可观测量的梯度或海森矩阵。这是当我们想要最小化与量子可观测量相关的代价函数时,一个关键且资源密集的任务。在我们的详细分析中,我们考虑了实现具有固定精度的QNDM方法所需的全部资源,并将其与当前最先进的方法进行了比较。结果表明,QNDM方法在评估代价函数的导数时更为高效,即所需资源更少。这些优势已经在小维度系统中显现出来,并且在实际实施和更现实的情况下可能会更加明显。我们的研究的一个重要成果是提供了Python实现的QNDM方法,详见补充材料。鉴于大多数变分量子算法都可以在这个框架内表述,我们的结果可能对量子优化算法具有重要意义,并使QNDM方法成为在近期量子计算机上实现变分量子算法的有价值替代方案。

量子物理
2025-04-01更新2024-04-02 发布

非马尔可夫环境中诱导的高阶 exceptional 点

Exceptional 点(EPs)因其独特的物理特性和潜在应用在非厄米物理学中一直占据核心地位。它们在宇称时间($\mathcal{P}\mathcal{T}$)对称系统或其他非厄米系统中得到了广泛研究;然而,在伪厄米系统与非马尔可夫环境相关的背景下鲜有研究。本文研究了在伪厄米条件下三耦合腔(标记为$a$、$b_1$和$b_2$)中的高阶EPs。具体而言,腔$a$同时与两个马尔可夫环境相互作用,而腔$b_1$和$b_2$分别与各自的马尔可夫环境耦合。通过腔$a$对两个输入场的相干完美吸收(CPA),我们获得了系统的有效增益。在特定参数条件下,系统的有效哈密顿量保持伪厄米性,通过测量系统的输出光谱可以观察到三阶exceptional点(EP3)。此外,我们将结果推广到非马尔可夫区域(仅腔$a$耦合的两个环境是非马尔可夫的,而与腔$b_1$和$b_2$耦合的另外两个环境是马尔可夫的),这导致四阶exceptional点(EP4)和五阶exceptional点(EP5)的出现。特别是,在非马尔可夫极限下(对应无限频宽),EP4和EP5在马尔可夫近似下可以退化为EP3。最后,我们将系统扩展到更一般的非厄米系统而不受伪厄米约束条件限制,并发现高阶EPs(EP6和EP7),其中所有四个环境均为非马尔可夫。这项研究将非厄米物理学扩展到了非马尔可夫动力学领域,预计将在量子光学和精密测量中产生深远影响。

光学
2025-04-01 发布

基于PSP/WISPR观测的Geminid模型与Phaethon尘埃尾的比较

NASA帕克太阳探测器(PSP)上的WISPR仪器的白光观测最近揭示了小行星3200 Phaethon轨道附近存在一条狭窄且密集的尘埃尾迹。尽管与Geminid相关,但它与Phaethon轨道以及已知的Geminid流星体轨道并不完全对齐。为了探讨该尘埃尾迹的性质,我们对WISPR尾迹观测结果与几种成熟的Geminid模型进行了详细对比。在WISPR视场内模拟这些模型显示,WISPR尾迹几乎肯定代表了Geminid流的真实“密度核心”。模型尾迹宽度和偏离Phaethon轨道的趋势,作为真近点角的函数,与观测结果在不同程度上一致。然而,由于光压效应,所有模型都将它们的“核心”置于母体轨道内部,这与WISPR尾迹位于Phaethon轨道外部的情况相矛盾。因此,Phaethon当前的轨道很可能不代表系统母体的轨道,母体的半长轴可能更大。这些发现为未来的Geminid模型提供了新的初始条件,而WISPR则确定了Geminid核心的位置。

地球与行星天体物理学
2025-04-01 发布

熵驱动学习实现长达两年的ENSO相位技能预测

本文扩展了先前的工作(Groom等,《人工智能与地球系统》,2024年),通过将熵最优稀疏概率逼近(eSPA)算法应用于基于尼诺3.4指数阈值定义的ENSO相位预测。仅使用卫星时代观测数据集进行训练和验证,同时利用2012年至2022年的回顾性预报评估长达24个月的样本外技能。我们引入了一种集成方法,而不是为每个预报提前期训练一个单独的eSPA模型,而是通过一种新的元学习策略聚合多个eSPA模型。所使用的特征包括全球海表温度延迟嵌入EOF分析的主成分、垂直温度梯度(作为温跃层的代理)以及热带太平洋风应力。关键的是,对数据进行了处理,以防止未来信息泄漏,确保真实的时间预报条件。尽管训练实例数量有限,但eSPA避免了过拟合,并产生了与国际气候与社会研究所(IRI)ENSO预测区间相当的技能概率预报。在IRI预报范围之外,eSPA在排名概率技能评分上保持到22个月的技能,在准确性和ROC曲线下面积上保持到24个月的技能,且计算成本仅为全耦合动力学模型的一小部分。此外,eSPA成功预测了2015/16年和2018/19年的厄尔尼诺事件,提前24个月;2016/17年、2017/18年和2020/21年的拉尼娜事件,提前24个月;以及2021/22年和2022/23年的拉尼娜事件,分别提前12个月和8个月。

计算物理
大气与海洋物理
2025-04-01更新2025-03-03 发布

一个模型解释一切:一个标度不变光谱检验一切,以及在一个模型中统一它们

宇宙微波背景(CMB)观测精度的不断提高揭示了不同数据集之间的显著张力,尤其是Planck与阿塔卡马宇宙学望远镜(ACT)之间,以及晚期宇宙对哈勃常数测量之间的张力。在本文中,我们探讨了一系列$\Lambda$CDM扩展模型,评估其解决这些不一致的能力。这些扩展模型的统计偏好仍然较为温和,并且施加$n_s=1$通常会削弱模型性能。我们的研究结果强调了对$\Lambda$CDM进行增量修改的局限性,并表明要么需要更复杂的新的物理理论,要么更可能的是需要改进对CMB领域系统误差的理解,才能完全解决观测到的张力。尽管CMB实验通常被视为精确宇宙学的黄金标准,但我们的结果进一步表明,这些测量并非不受系统不确定性的影响,而当前分析中可能低估了这些不确定性。

宇宙学和非星系天体物理学
2025-04-01更新2025-03-06 发布

纯辫群自同构对二维球面同伦群的作用

我们研究了与纯辫群相关的Delta-群结构的Moore复形,该结构由Berrick、Cohen、Wong和Wu引入。我们证明了循环群和边界群在纯辫群的所有自同构下保持不变,从而推广了Li和Wu关于反射自同构的结果。我们得出结论,纯辫群的所有自同构都诱导出对二维球面同伦群的作用,并且我们计算了少量辫子情形下的这种作用。

群论
代数拓扑
几何拓扑
20F36, 55Q40, 20F28 (Primary) 55U10 (Secondary)
2025-04-01更新2021-12-10 发布

基于大型语言模型的多模态人工智能系统在多主题物理概念库存上的多语言表现

我们利用来自PhysPort网站的一组涵盖多种语言和主题类别的物理概念库存,研究了基于大型语言模型的人工智能系统(GPT-4o)的多语言和多模态性能。这些库存涉及经典物理学主题,如力学、电磁学、光学、热力学以及相对论、量子力学、天文学、数学和实验技能。不同于以往仅限文本的研究,我们将库存以图像形式上传,以反映学生在纸面上看到的内容,从而评估系统的多模态功能。我们的结果显示,不同主题的表现存在差异,其中实验技能表现最弱。同时,不同语言之间也存在差异,英语和欧洲语言表现最强。值得注意的是,库存项目的相对难度很大程度上独立于调查的语言。与现有文献中关于学生表现的比较显示,该人工智能系统在除实验技能外的所有主题类别中的表现均优于平均的本科后教学学生。此外,系统在需要解读图像的问题上的表现比纯文本问题上的表现更差。

物理教育
人工智能
2025-04-01更新2025-01-10 发布

CFP:基于低开销剖析的通信无结构内算子并行性生成

本文介绍了一个名为CFP的系统,该系统通过利用实际并行程序的运行时剖析来搜索内算子并行性配置。其核心思想是通过识别一种新的结构——ParallelBlock(一组具有通信自由张量划分传播属性的操作符)来剖析有限的空间:即输入张量的划分可以通过所有操作符传播到输出张量,而不会引入通信或同步。基于此属性,可以在避免不必要的通信前提下,从输入张量的划分推断出ParallelBlock内部操作符的最佳张量划分。因此,可以通过仅在每个ParallelBlock入口处以不同的输入张量划分进行剖析,而不是枚举ParallelBlock内部所有操作符的所有组合,从而减少搜索空间。此外,通过识别具有相似并行行为的ParallelBlock序列(段),进一步减少了搜索空间。CFP基于所有段的剖析结果计算模型的整体性能。在GPT、LLAMA和MoE模型上,CFP相比最先进的框架Alpa分别实现了高达1.51倍、1.31倍和3.43倍的速度提升。

分布式、并行与集群计算
2025-04-01 发布

多语言上下文在检索增强生成中的一致性研究

基于大型语言模型(LLMs)的检索增强生成(RAG)在多语言问答(QA)任务中表现出色,通过利用从语料库中检索的相关段落实现高效问答。在多语言RAG(mRAG)中,检索到的段落可能使用用户查询语言以外的语言书写,这给LLMs有效利用这些信息带来了挑战。近期研究表明,从多语言语料库中检索段落可以提高RAG性能,尤其是在低资源语言中表现尤为突出。然而,LLMs在独立于检索质量的情况下,如何有效利用不同类型的多语言上下文生成准确答案的问题仍缺乏深入研究。本文对LLMs在以下三方面的能力进行了全面评估:(i) 不论相关段落的语言为何,都能保持一致地加以利用;(ii) 能够以预期语言进行响应;(iii) 即使在包含多个“干扰”段落的情况下,也能专注于相关段落。通过对四个LLMs在三个QA数据集(涵盖总计48种语言)上的实验发现,LLMs能够从跨语言段落中提取相关信息,但在正确语言中生成完整答案的能力较弱。我们的分析基于准确率和特征归因技术进一步表明,无论干扰段落的语言为何,都会对答案质量产生负面影响,而使用查询语言的干扰段落影响略强。综合来看,本研究深化了对LLMs在mRAG系统中利用上下文方式的理解,为未来改进提供了方向。

计算与语言
人工智能
2025-04-01 发布

基于密度相关SDE的定量逼近:由$α$-稳定过程驱动的情况

借助一类适度相互作用粒子系统,我们建立了基于密度相关的McKean-Vlasov随机微分方程(SDE)及其对应的非线性、非局部偏微分方程(PDEs)的定量逼近。该SDE由布朗运动和纯跳跃Lévy过程共同驱动。通过运用Duhamel公式、密度估计以及适当的鞅泛函不等式,我们得到了粒子系统的经验测度收敛到McKean-Vlasov SDE解的法律的精确收敛速度。此外,我们量化了一维粒子边缘分布与McKean-Vlasov SDE解之间的弱收敛和路径收敛。值得注意的是,所有收敛速度均独立于噪声类型。

概率论
2025-04-01 发布

个性化对齐研究综述——大型语言模型在实际应用中的缺失环节

大型语言模型(LLMs)展现出卓越的能力,但在向实际应用场景过渡时暴露出一个关键局限性:无法在保持与普遍人类价值观一致的同时适应个体偏好。现有的对齐技术采用一刀切的方法,未能满足用户多样化背景和需求。本文首次对个性化对齐这一范式进行了全面综述,该范式使LLMs能够在伦理边界内根据个体偏好调整其行为。我们提出了一种统一框架,包括偏好记忆管理、个性化生成和基于反馈的对齐,系统地分析了实现方法并评估了其在各种场景下的有效性。通过审视现有技术、潜在风险和未来挑战,本综述为开发更具适应性和伦理一致性的LLMs提供了结构化的基础。

计算与语言
2025-04-01更新2025-03-21 发布

AWAKE向欧洲粒子物理战略更新提交的报告——代表AWAKE合作组

高级尾场实验(AWAKE)是一项已确立的国际性合作项目,旨在开发质子驱动等离子体尾场加速技术,将电子束加速至适合首次应用于粒子物理研究的能量和品质(约50-200 GeV)。数值模拟表明,通过单个质子驱动的等离子体尾场阶段即可实现平均加速梯度约为1 GeV/m的能量提升,这得益于CERN超级质子同步加速器(SPS,19 kJ,400 GeV)及大型强子对撞机(LHC,约120 kJ,7 TeV)高能质子束团的特性。同步加速器产生的束团较长,AWAKE利用自调制过程驱动具有GV/m幅度的尾场。截至2025年底,与自调制相关的所有物理概念将在始于2016年的AWAKE实验计划中得到实验证实。主要成果包括:直接观测到自调制现象,通过两种种子方法实现稳定化与控制,将外部注入电子从19 MeV加速至超过2 GeV,并在自调制饱和后利用等离子体密度台阶维持高尾场振幅。除简要总结迄今为止取得的成就外,本文还概述了AWAKE作为演示设施的路线图,旨在生产适用于首次应用的高品质束流。该计划包括:1)到2031年在10米等离子体中将质量可控的电子束加速至多GeV能量;2)通过LS4展示更高能量的可扩展性。文中强调了AWAKE研发工作中与推进等离子体尾场加速相关的协同效应。我们主张欧洲粒子物理战略更新应大力支持AWAKE及其类似先进的加速器研发工作。

加速器物理
2025-04-01 发布

作为量子参考系变换的量子伽利略群

量子群已被广泛研究作为一种工具,用于编码可能的非平凡参考系变换推广,这在量子引力中有重要意义。在量子信息领域,发现参考系可以与量子粒子相关联,从而导致量子参考系变换。这两个框架之间的联系仍未被探索,但如果阐明,将有助于更深入地理解量子力学和量子引力中的对称性。在这里,我们建立了量子变形伽利略群(具有交换时间)在一阶量子变形参数下的变换与量子参考系变换之间的对应关系。这一结果是在量子群非交换变换参数在量子粒子相空间上表示,并且将量子变形参数设为与充当量子参考系的粒子质量成反比的情况下得出的。这些结果使我们能够证明,当量子参考系的状态处于半经典态的量子叠加时,量子参考系变换在物理上是有意义的。我们推测,全阶量子伽利略群描述了量子参考系之间更一般量子态的参考系变换。

量子物理
广义相对论与量子宇宙学
高能物理-理论
数学物理
数学物理
2025-04-01 发布

共 13511 条搜索结果

共 13511 条