分类

包含非流体模式的全息Schwinger-Keldysh有效场论

我们从全息Gubser-Rocha系统出发,推导出包含最低非流体自由度的扩散Schwinger-Keldysh有效场论。在低温下,动力学非流体模式可以是红外模式或慢模式,这与红外量子临界激发有关,或者编码了所有能量尺度的信息。这一额外的动力学矢量模式可被视为扩散流体力学理论的紫外部分。我们针对每种情况构建了两种不同的有效作用量,并讨论了它们的物理性质。特别是,我们证明了Kubo-Martin-Schwinger对称性得以保持。

高能物理-理论
强关联电子体系
广义相对论与量子宇宙学
2025-04-02更新2024-11-25 发布

全局Glauber理论中的核-核反应截面与相互作用截面

使用生成函数方法在Glauber近似下直接计算了核散射的反应截面和相互作用截面,这种方法允许对Glauber理论的所有阶项进行重新求和。得到了${}^4$He、${}^{11}$Li、${}^{12}$C对${}^{12}$C靶的散射结果。结果显示,反应截面与微分截面之间的差异不超过几个百分点。

原子核物理-理论
高能物理-唯象学
2025-04-02 发布

循环对比知识迁移用于开放词汇目标检测

为了检测超出预定义类别范围的对象,现有的开放词汇目标检测(OVD)方法通常依赖于预训练的视觉-语言模型(VLMs)以实现基础到新类别的泛化。然而,为了解决上游图像-文本预训练与下游区域级感知之间的错配问题,额外的监督必不可少,例如图像-文本对或通过自训练策略生成的伪标注。在本文中,我们提出了CCKT-Det,该方法无需任何额外监督即可进行训练。所提出的框架从VLM提取的语言查询和视觉区域特征构建了一个循环且动态的知识迁移过程,迫使检测器紧密对齐VLM的视觉语义空间。具体而言,1)我们预过滤并注入语义先验以指导查询的学习,2)引入区域对比损失以提高查询对新对象的敏感度。随着VLM规模的增加,CCKT-Det可以持续提升性能,同时检测器仅需适度的计算开销。全面的实验结果表明,我们的方法在具有挑战性的COCO基准测试中,相较于先前的最先进方法分别获得了+2.9%和+10.2%的AP50性能提升,无论是否使用更强的教师模型。

计算机视觉与模式识别
I.4.8; I.2.6
2025-04-02更新2025-03-14 发布

利用光前端波函数理解光子的TMDs

本文尝试通过量子色动力学中的横向动量依赖部分子分布函数(TMDs)来理解光子的横向结构。我们利用光前端波函数计算了所有可能的时间反转光子TMDs。在本工作中,我们将光子视为夸克-反夸克对的Fock态。通过螺旋度振幅,我们以重叠和显式形式给出了所有9个T偶数TMDs的光前端波函数表达式。我们观察到,对于真实光子,只有3个TMDs非零,而对虚光子则有8个。我们简要讨论了实光子和虚光子的未极化TMD $f_1(x,\textbf{k}_\perp)$、纵向极化TMD $g_{1L}(x,\textbf{k}^2_\perp)$、横向极化TMD $h_1(x,\textbf{k}^2_\perp)$以及张量极化TMD $f_{1LL}(x,\textbf{k}^2_\perp)$。

高能物理-唯象学
2025-04-02 发布

某些积分表示非零性的研究

本文证明了存在Whittaker函数和Schwartz函数,使得局部Flicker积分在所有复数值$s$下均不为零,局部Bump-Friedberg积分在所有复数对$(s_1,s_2)$下均不为零。作为推论,我们确定了相应部分$L$-函数可能的极点位置。

数论
表示论
11F70, 22E55
2025-04-02更新2024-12-13 发布

评估横断面阶梯楔形集群随机试验中的中介效应

中介分析在独立数据中已有全面研究,但对于相关数据(特别是日益采用的阶梯楔形集群随机试验,SW-CRTs)的研究相对较少。受务实和实施科学临床试验中理解效应机制挑战的启发,我们为SW-CRTs开发了新的中介分析方法。具体而言,基于线性和广义线性混合模型,我们展示了如何估计典型SW-CRTs中四种数据类型(包括连续和二元中介变量及结果)的自然间接效应和中介比例。此外,为了应对暴露时间治疗效应异质性的新兴挑战,我们推导出当总效应随暴露时间变化时SW-CRTs中的中介表达式。对于所有数据类型和治疗效应结构,考虑了聚类刀切法进行推断。我们进行了广泛的模拟,评估所提出的中介估计量的有限样本性能,并在真实数据示例中展示所提出的方法。开发了一个用户友好的R包mediateSWCRT,以促进估计量的实际应用。

方法论
2025-04-02更新2024-10-21 发布

星际介质

星际介质(ISM)是填充所有星系中恒星间空间的物质;它是一种多相介质,处于压力平衡状态,密度和温度跨度超过6个数量级。尽管只占单个星系质量的一小部分,但它是一个至关重要的组成部分,因为它保存了通过恒星形成促进星系增长的物质。研究星际介质需要在电磁波谱的所有波段进行仔细观测。本文描述了星际介质的多相特性,并将其置于星系演化模型的背景下,强调了重子在星系内外循环的重要性。在这个框架内,星际介质发挥了核心作用:它连接了控制气体向星系吸积的非常大的物理和时间尺度上的物理过程,以及调节恒星形成的较小尺度过程。

星系天体物理学
2025-04-02 发布

基于跨注意力融合超图神经网络的药物-靶点结合亲和力预测:HCAF-DTA模型

药物与靶蛋白之间结合亲和力的准确预测是计算机辅助药物设计的核心任务。现有的深度学习方法往往忽略了药物分子内部亚结构特征以及药物-靶点相互作用的信息,导致预测性能有限。本文提出了一种基于跨注意力融合超图神经网络的药物-靶点关联预测模型HCAF-DTA。该模型在特征提取阶段创新性地引入了超图表示:基于树分解算法构建药物分子超图,并通过跳跃连接将超图神经网络与图形神经网络融合,提取亚结构和全局特征,其中超边能够高效表征功能基团及其他关键化学特征;对于蛋白质特征提取,基于ESM模型预测的接触图构建加权图,并采用多层图神经网络捕获空间依赖关系。在预测阶段,设计了双向多头跨注意力机制,从原子和氨基酸的双重视角建模分子间相互作用,并通过注意力机制融合具有相关性的跨模态特征。在Davis和KIBA等基准数据集上的实验表明,HCAF-DTA在均方误差(MSE)等三项性能评估指标上均优于现有最先进的方法,分别达到0.198和0.122,相比最优基线提升了高达4%。

生物分子
人工智能
机器学习
2025-04-02 发布

基于上下文增强的大语言模型改进SZZ算法:LLM4SZZ

SZZ算法是识别引起错误提交的主要技术,并为许多软件工程研究(如错误预测和静态代码分析)奠定了基础。自提出以来,研究者们提出了许多变体来提升SZZ算法的性能。大多数变体依赖静态技术和启发式假设,虽然易于实现,但性能提升有限。近期,基于深度学习的SZZ算法被引入以改进原始SZZ算法。然而,该方法需要复杂的预处理且仅限于单一编程语言。此外,尽管提升了精确度,却牺牲了召回率。并且,大多数变体忽略了提交信息和补丁上下文等重要信息,仅限于涉及删除行的错误修复提交。大型语言模型(LLMs)的出现为解决这些问题提供了机会。在本研究中,我们探讨了LLMs的优势和局限性,并提出了LLM4SZZ,采用两种方法(即基于排名的识别和基于上下文增强的识别)处理不同类型的错误修复提交。我们根据LLM理解错误并判断错误是否存在于提交中的能力,决定采用哪种方法。在基于上下文增强的识别中,我们为LLM提供更多的上下文,并要求其从一组候选提交中找到引起错误的提交。在基于排名的识别中,我们让LLM从错误修复提交中选择有问题的语句,并根据它们与根本原因的相关性对它们进行排名。实验结果表明,LLM4SZZ在三个数据集上均优于所有基线,F1分数提高了6.9%到16.0%,同时没有显著降低召回率。

软件工程
2025-04-02 发布

一切补丁皆重要,更多补丁更佳:通过全景补丁学习增强AI生成图像检测

AI生成图像(AIGIs)的指数增长凸显了对鲁棒且可泛化的检测方法的迫切需求。本文通过系统分析建立了AIGI检测的两条关键原则:\textbf{(1)一切补丁皆重要}:与传统图像分类中判别特征集中在对象中心区域不同,由于统一生成过程,AIGIs中的每个补丁都内在地包含合成伪影,表明每个补丁都是重要的伪影来源;\textbf{(2)更多补丁更佳}:利用分布在更多补丁中的分散伪影可以捕获互补的取证证据,并减少对特定补丁的过度依赖,从而提高鲁棒性和泛化能力。然而,我们的反事实分析揭示了一个令人不安的现象:未经适当训练的检测器往往表现出一种\textbf{少数补丁偏见},即基于少数补丁区分真实图像和合成图像。我们确定\textbf{懒惰学习者}为根本原因:检测器倾向于优先学习有限补丁中的显眼伪影,而忽略更广泛的伪影分布。为了解决这种偏见,我们提出了\textbf{全景补丁学习(PPL)框架},包括:(1)随机补丁替换,随机用真实补丁替换合成补丁,迫使模型识别利用率较低区域中的伪影,鼓励更广泛地利用更多补丁;(2)补丁级对比学习,确保所有补丁具有一致的判别能力,保证所有补丁的均匀利用。在多个基准数据集上的多种实验验证了我们的方法的有效性。

计算机视觉与模式识别
2025-04-02 发布

从易到难:构建差分隐私图像合成的捷径

差分隐私(DP)图像合成旨在从敏感数据集中生成合成图像,减轻组织在共享和利用合成图像时的隐私泄露担忧。尽管先前的方法在训练敏感图像上的扩散模型方面取得了显著进展,特别是在使用差分隐私随机梯度下降(DP-SGD)方面,但其性能仍不尽如人意。本文受课程学习的启发,提出了一种两阶段的差分隐私图像合成框架,使扩散模型从简单到复杂地学习生成差分隐私合成图像。与现有直接使用DP-SGD训练扩散模型的方法不同,我们提出了一个简单的初始阶段,使扩散模型能够学习敏感图像的简单特征。为促进这一简单阶段,我们建议使用“中心图像”,即敏感数据集随机样本的简单聚合。直观来看,虽然这些中心图像不显示细节,但它们展示了所有图像的有用特征,并且仅带来最小的隐私成本,从而有助于早期模型训练。实验结果表明,在四个调查数据集的平均情况下,我们合成图像的保真度和实用性指标比最先进的方法分别提高了33.1%和2.1%。

密码学与安全
人工智能
2025-04-02 发布

更快速且简洁的字符串网络频率在线计算方法

字符串 $S$ 中重复子串 $u$ 的出现被称为网络出现(net occurrence),如果向左或向右扩展该出现会使出现次数减少为 1。字符串 $S$ 中重复子串 $u$ 的网络频率(NF)定义为其在 $S$ 中的所有网络出现次数。最近,Guo 等人 [SPIRE 2024] 提出了一种在线 $O(n \log \sigma)$ 时间算法,维护了一个 $O(n)$ 空间的数据结构,可以在 $O(m \log \sigma + \sigma^2)$ 时间内回答单次 NF 查询,并在 $O(n\sigma^2)$ 时间内报告 All-NF 问题的所有答案。这里,$n$ 是输入字符串 $S$ 的长度,$m$ 是查询模式的长度,$\sigma$ 是字母表的大小。$\sigma^2$ 是其方法的主要缺点,因为计算字符串网络频率最初是为中国语言处理设计的,而其中 $\sigma$ 可能非常大。本文提出了一种改进的在线 $O(n \log \sigma)$ 时间算法,单次 NF 查询的时间复杂度降为 $O(m \log \sigma)$,并在输出最优的 $O(|\mathsf{NF}^+(S)|)$ 时间内报告 All-NF 问题的所有答案,其中 $\mathsf{NF}^+(S)$ 是字符串 $S$ 中具有正 NF 值的子串集合。我们注意到,$|\mathsf{NF}^+(S)| = O(n)$ 始终成立。与基于 Ukkonen 后缀树构造的 Guo 等人的算法不同,我们的算法基于 Weiner 后缀树构造。

数据结构与算法
2025-04-02更新2024-10-09 发布

BMN膜动力学的湍流方面

我们研究了BMN矩阵模型在大N极限下的情况,其中经典的玻色膜具有球面拓扑,并在11维极大超对称平面波背景下内部旋转。首先,我们基于其分量在SO(3)×SO(6)对称平面波时空中的分布,对所有可能的M2-膜构型进行了分类。然后,我们提出了几个简单但非常有代表性的介电顶点旋转的假设。我们考察了这些构型范围内的主导径向和角/多极稳定性。通过分析次主导阶的扰动,我们发现它们表现出不稳定性湍流级联的现象。因此,长波长扰动通过其非线性耦合产生更高阶的多极不稳定性。

高能物理-理论
81T30, 81T35, 83E30
2025-04-02更新2024-12-03 发布

ByteCheckpoint:面向大规模基础模型开发的统一检查点系统

在大型基础模型(LFM)开发过程中,保存训练状态的检查点机制至关重要,可用于应对各种故障或GPU资源及并行配置的变化导致的训练中断。此外,保存的检查点会被分发到评估任务或在不同训练阶段之间传输(例如从预训练到后训练)。所有这些场景都需要将分布式检查点从一种并行模式重分配到另一种并行模式。在生产环境中,不同的LFM会根据模型大小和训练规模使用不同的框架和存储后端进行训练。因此,需要一个高性能的检查点系统来在整个LFM开发生命周期中实现高效的检查点管理。我们介绍了ByteCheckpoint,这是一个面向大规模LFM训练的工业级检查点系统。ByteCheckpoint具有以下特点:一种与并行模式无关的检查点表示方法,可实现高效的加载时检查点重分配;一种通用的检查点保存/加载工作流,以适应多种训练框架并支持不同的存储后端;全栈优化以确保高I/O效率和可扩展性;一套监控工具,用于简化大规模性能分析和瓶颈检测。与现有的开源检查点系统[52, 58]相比,ByteCheckpoint显著减少了运行时检查点停滞时间,平均减少了54.20倍。对于保存和加载时间,ByteCheckpoint分别实现了高达9.96倍和8.80倍的改进。

人工智能
2025-04-02更新2024-07-29 发布

光污染环境下彗星观测:星际彗星2I/鲍里索夫案例研究

彗星和小行星长期以来引起了人类的好奇心,直到最近,所有已记录的例子都属于我们的太阳系。2017年,第一个已知的星际天体1I/2017 U1('Oumuamua)的发现改变了这一局面。两年后,根纳季·鲍里索夫发现了第二个星际天体:2I/鲍里索夫。从其最初的图像来看,该天体的弥散外观暗示了它的彗星性质。为了更好地理解彗星2I在穿越内太阳系时的光度演化,我们利用中型望远镜收集了观测数据。这些数据对于了解其大小和组成以及此类天体在数百万年后暴露于太阳辐射下的行为至关重要。鉴于2I是首次观测到的星际彗星,限制其行为具有重要的科学意义。本文展示了从克里米亚和加泰罗尼亚的天文台收集的测光数据,强调了使用一米级望远镜对星际天体进行系统测光研究的重要性。我们的观测显示,随着彗星接近近日点,其亮度稳步增加,这可能归因于冰的缓慢升华。在近日点前的观测期间,我们没有检测到显著的星等变化。观测分析揭示了彗星亮度随其接近近日点而稳步增加,可能由于冰的升华,且在五个月的近日点前观测期内未观察到爆发现象。此外,我们讨论了当前地面观测彗星面临的光污染挑战,特别是在城市地区,视觉观测受到严重限制。通过表面亮度测量样本,我们展示了光污染的影响,并强调了对星际天体进行系统测光研究的重要性。

地球与行星天体物理学
天体物理学仪器和方法
2025-04-02更新2025-03-26 发布

虚拟现实与人工智能在太空及其他隔离封闭环境中的心理对策作用:一项范围综述

太空飞行是一种隔离封闭环境(ICE),宇航员会面临压力、危险和单调等心理危害。虚拟现实(VR)和人工智能(AI)技术可以作为心理对策,因为它们能够数字化模拟沉浸式环境、交互式伙伴以及治疗性体验。本研究采用范围文献综述的方法,识别目前关于利用VR和基于AI的干预措施改善太空或其它ICE成人情绪或情感状态的知识现状及其有效性。此外,该综述还旨在确定知识空白,并判断是否需要进行包含元分析的系统综述。综述纳入的研究中,干预措施被用于或计划用于太空或其他地外环境中(ICE)。我们的检索策略从七个主要数据库的3390条记录中筛选出19项研究。所有研究均聚焦于基于VR的干预措施,未发现符合条件的基于AI的干预研究。研究发现,VR干预在放松、改善情绪、应急培训、作为交互式沟通平台、比较室内设计以及提升锻炼效果方面有效;情绪和情感指标(如焦虑和压力)有所改善,但用户偏好存在差异,且报告了部分晕动症案例。由于结果的异质性,不建议进行包含元分析的系统综述。未来应进一步研究使用标准化评估工具,针对更广泛的情绪变量应用VR的重要性。此外,AI作为心理对策的潜在应用也值得进一步探索。

人机交互
人工智能
多媒体
2025-04-02 发布

Macaulay2中的连接矩阵

本文介绍了Macaulay2软件包ConnectionMatrices的理论基础,并解释了如何使用该软件包。对于在权向量依赖的消去项序下具有有限正则秩的Weyl代数中的左理想,我们实现了以连接形式计算所编码的线性偏微分方程组的算法。同时,我们还实现了有理函数域上的基变换对应的规范变换。通过示例演示了所有实现的算法。

代数几何
符号计算
2025-04-02 发布

对抗样本汤:免费提升可迁移性和隐蔽性

可迁移对抗样本由于无需了解目标模型内部知识即可误导其运行,从而带来了实际的安全风险。传统上,为最大化对抗样本的可迁移性,仅保留优化过程中获得的所有对抗样本中的最优样本。本文首次重新审视这一惯例,并证明那些被丢弃的次优对抗样本可以被重新利用以增强可迁移性。具体而言,我们提出了“对抗样本汤”(AES),包括在超参数调整时通过AES-tune对丢弃的对抗样本进行平均处理,以及通过AES-rand进行稳定性测试。此外,我们的AES受到“模型汤”的启发,后者通过平均多个微调后的模型权重来提高准确性而不增加推理时间。大量实验验证了AES的整体有效性,使10种最先进的迁移攻击及其组合对10种不同的(防御性)目标模型的攻击成功率提高了多达13%。我们还展示了AES可以推广到其他类型的可能性,例如直接平均多个野外对抗样本,其成功率相当。AES的一个有前景的副产品是提升了对抗样本的隐蔽性,因为扰动方差自然减小。

计算机视觉与模式识别
2025-04-02更新2024-02-27 发布

面向空中联邦学习的时龄感知部分梯度更新策略

我们提出了一种面向空中联邦学习的时龄感知策略,用于更新梯度。该系统包含边缘服务器和多个客户端,它们协作以最小化全局损失函数。在每次通信轮次中,客户端执行本地训练,将梯度更新调制到一组共享的正交波形上,并同时将模拟信号传输给边缘服务器。边缘服务器从接收到的无线电信号中提取出带有噪声的聚合梯度,更新全局模型并广播给客户端进行下一轮本地计算。尽管允许所有客户端在每轮通信中上传信息,但系统受到可用波形载波数量有限的限制,只能传输全局模型的部分梯度参数。为了解决这一问题,我们的方法在边缘服务器上维护一个时龄向量,跟踪全局模型每个坐标上次更新的时间。服务器利用此信息优先选择需要传输的梯度条目,确保过时但仍重要的参数能够更频繁地得到更新。我们推导了所提算法的收敛速率以量化其有效性。此外,基于MNIST和CIFAR-10数据集的实验评估表明,与基线方法相比,我们的方法实现了更高的准确率和更稳定的收敛性能,展示了其在提高空中联邦学习系统通信效率方面的潜力。

分布式、并行与集群计算
2025-04-02 发布

小内存环境下的私有合成数据生成

我们提出了$\mathtt{PrivHP}$,这是一种具有\textit{差分隐私}保证的轻量级合成数据生成器。$\mathtt{PrivHP}$采用了一种新颖的层次分解方法,能够在有限内存中近似输入的累积分布函数(CDF)。它在平衡层次深度、噪声添加以及低频子域剪枝的同时保留高频子域。私有草图能够高效地估计子域频率,而无需访问完整数据。其关键特性是剪枝参数$k$,用于控制空间复杂度与实用性之间的权衡。我们定义了偏斜度量$\mathtt{tail}_k$,捕获除了前$k$个子域频率之外的所有信息。给定一个数据集$\mathcal{X}$,$\mathtt{PrivHP}$使用$M=\mathcal{O}(k\log^2 |X|)$的空间,并且对于输入域$\Omega = [0,1]$,确保$\varepsilon$-差分隐私。它生成的生成器与经验分布之间的预期Wasserstein距离为:\[ \mathcal{O}\left(\frac{\log^2 M}{\varepsilon n} + \frac{||\mathtt{tail}_k(\mathcal{X})||_1}{M n}\right) \] 这种可参数化的权衡提供了先前工作中无法实现的灵活性。此外,我们还提供了可解释的实用性界限,考虑了层次深度、隐私噪声、剪枝以及频率估计误差等因素。

密码学与安全
数据结构与算法
2025-04-02更新2024-12-12 发布

共 13511 条搜索结果

共 13511 条