Research

arXiv

分类

音频水印被越来越多地用于验证人工智能生成内容的来源，支持检测人工智能生成的语音、保护音乐知识产权以及防范语音克隆等应用。为了有效发挥作用，音频水印必须能够抵抗旨在规避检测的去除攻击。尽管许多方案声称具有鲁棒性，但这些声明通常是在隔离条件下针对有限类型的攻击进行测试的。目前缺乏对多样化去除攻击的系统性评估，阻碍了实际部署。本文研究了声称具有鲁棒性的近期水印方案是否能够抵御广泛的去除攻击。首先，我们引入了一个涵盖22种音频水印方案的分类法。接着，我们总结了其底层技术和潜在漏洞。然后，我们进行了大规模的经验研究，以评估其鲁棒性。为此，我们构建了一个包含22种去除攻击（共计109种配置）的评估框架，包括信号级、物理级和人工智能诱导的失真。我们使用开源代码重现了9种水印方案，并发现了8种新的高效攻击方式，同时揭示了11个关键发现，这些发现暴露了这三种公共数据集上这些方法的根本局限性。我们的结果表明，没有一种被调查的方案能够抵御所有测试的失真。这项评估为当前水印方法在现实威胁下的表现提供了全面的视角。我们的演示和代码可在https://sokaudiowm.github.io/获取。

密码学与安全

人工智能

2025-03-27更新2025-03-24 发布

本文提出了一种新的概念——基于模糊逻辑的模型预测控制（FLMPC），并结合一种多机器人控制方法用于探索未知环境和定位目标。传统的模型预测控制（MPC）方法依赖贝叶斯理论来表征环境知识并优化随机代价函数，这通常会导致较高的计算成本，并且在定位所有目标时效果不佳。我们的方法转而利用FLMPC，并通过双层主从架构对其进行扩展，以增强协调性和扩展决策范围。FLMPC通过从概率分布和局部观测中提取高级信息，简化了优化问题，并显著延长了与其他MPC方法相比的操作时间范围。我们在包含随机放置障碍物和人类的未知二维环境中进行了广泛的仿真。我们比较了FLMPC与具有随机代价函数的MPC的性能和计算时间，然后评估了集成高级主FLMPC层的影响。结果表明，我们的方法显著提高了性能和计算效率，增强了机器人的协调性，并减少了在大规模搜索和救援环境中不确定性的影响。

我们介绍了在线服务cosmICweb（COSMological Initial Conditions on the WEB）——首个用于存储、分析和分发宇宙学局部放大模拟初始条件的数据库及网络界面：从星系团到单个星系及其他天体。具体而言，我们保存了典型模拟合并树中所有天体拉格朗日原初晕块的压缩信息，以及这些晕块/星系在整个宇宙时标上的属性。这使得用户能够通过网页方便地选择满足特定条件的目标局部放大区域。随后，可以利用这些区域信息结合MUSIC代码生成局部初始条件。除了其他一些模拟外，我们目前支持EAGLE模拟数据库中的所有天体，例如，我们明确展示了如何轻松重现Auriga系列模拟。该框架可通过应用程序编程接口（API）扩展至其他模拟，并与现有数据库结构集成，从而实现与cosmICweb的对接。我们将该网络门户和数据库向公众开放，供整个科学界使用。

宇宙学和非星系天体物理学

星系天体物理学

2025-03-27更新2024-06-04 发布

本研究聚焦于猎户座分子云中的I类、平谱（FS）及II类盘，该区域为邻近活跃的恒星形成区，拥有大量年轻恒星天体（YSOs），旨在揭示这些盘中亚结构形成的迹象。我们基于稀疏建模（SpM）对ALMA存档Band 6连续波数据进行二维超级分辨率成像，实现了78个尘埃盘的空间分辨率接近几天文单位（0".02-0".2）的图像，所有盘均被空间分辨。在样本中，我们确认约30%-40%的盘表现出亚结构，并在15个盘中识别出新的亚结构（包括4个I类、7个FS类和4个II类目标）。与eDisk样本相比，我们的目标在玻尔兹曼温度（Tbol）方面处于相对较晚的吸积阶段。通过将我们的目标与eDisk样本结合，我们证实亚结构检测局限于Tbol超过200-300 K且尘埃盘半径（Rdust）大于~30 au的对象。此外，我们发现II类盘的倾角分布高值缺乏，且不随机。分析这些对象周围的分子线发射数据将对进一步约束盘演化阶段并理解亚结构形成的时间和方式至关重要。

图像和视频编辑的生成方法利用生成模型作为先验，在信息不完整的情况下进行编辑，例如改变单个图像中显示的3D对象的组成。近期的方法在图像设置下展示了有前景的组成编辑结果，但在视频设置下，编辑方法主要集中在编辑对象的外观和运动或相机运动上，因此仍缺乏用于编辑视频中对象组成的解决方案。我们提出了\name方法，用于编辑静态场景视频中具有相机运动的3D对象组成。我们的方法允许以时间一致性的方式编辑视频中所有帧中的3D对象位置。这是通过将生成模型的中间特征提升到共享于所有帧之间的3D重建，编辑该重建，并将特征投影回每个帧上的编辑重建来实现的。据我们所知，这是首个用于编辑视频中对象组成的生成方法。我们的方法简单且无需训练，同时优于最先进的图像编辑基准。

计算机视觉与模式识别

2025-03-27更新2025-03-03 发布

背景。蓝离散星（BSS）的研究为理解恒星在双星演化过程中的质量交换机制以及密集恒星系统中的复杂引力相互作用提供了重要线索。结合这些研究，可以增强我们对恒星可能生命周期以及星团演化路径的理解。目标。我们利用Gaia数据发布版3（DR3）的光度、自行和视差，研究了41个球状星团（GCs）和42个疏散星团（OCs）中的BSS群体，确认其成员身份。我们共发现了4399颗BSS：所有GCs都显示存在BSS（占样本的约90%，即3965颗），而只有129个研究的OCs中有42个显示存在BSS（占样本的约10%，即434颗）。年龄小于约500 Myr的星团不包含任何BSS。方法。我们基于颜色-温度关系、等时线模型以及Gaia DR3光谱（如可用）推导了它们的天体物理参数，如有效温度、表面重力和质量。我们发现球状星团和疏散星团的BSS有效温度分别为$T_{\rm eff}=(6800 \pm 585) \ {\rm K}$和$(7570 \pm 1400) \ {\rm K}$；平均质量分别为$\langle M_{\rm BSS} \rangle = (1.02 \pm 0.1) \ {M_\odot}$和$\langle M_{\rm BSS} \rangle = (1.75 \pm 0.45) \ {M_\odot}$。我们还计算了每个识别出的BSS与其所属星团主序星拐点（MSTO）质量之间的质量差异，并归一化为MSTO质量。结果。基于这一参数和由等时线模型得出的BSS年龄，我们发现：i) 最有可能通过碰撞形成的GC BSS在约1-2 Gyr的年龄范围内显示出“增强”，这与之前研究中报告的GC核心坍缩事件的年龄一致；ii) GC BSS存在双序列，这可能暗示了合并前后或近密双星情景的迹象。

太阳和恒星天体物理学

2025-03-26 发布

在本文中，我们研究了当前具有最先进的Word RAM算法的核心问题的相对难度，这些算法对于由$\Theta(n)$个机器字（即$\Theta(n\log n)$位）描述的实例运行时间为$O(n\sqrt{\log n})$。这一复杂度类别是Chan和P\u{a}tra\c{s}cu [SODA 2010]识别出的六个硬度级别之一，涵盖了来自多个领域的多样化问题：计数逆序对、字符串处理问题（如后缀数组构造、LZ77因子分解、最长公共子串、批量最长前缀因子查询、批量逆后缀数组查询）、以及计算几何任务（如正交范围计数、正交段相交）。我们的主要贡献有两点：我们建立了上述字符串问题与经典任务Dictionary Matching之间的新联系，该任务可以通过Aho-Corasick自动机解决。我们将Dictionary Matching限制为具有$O(n)$个长度为$m=O(\log n)$的二进制模式的实例，并证明，除非这些实例可以在$o(n\sqrt{\log n})$时间内解决，否则上述字符串问题也无法更快地解决。通过进一步的归约，我们将这种难度扩展到计数逆序对（这是几何算法中的一个基本组成部分）以及正交范围计数和正交段相交。这依赖于String Nesting，这是一个新的问题，它等价于Dictionary Matching，并且可以通过三个步骤归约为计数逆序对。我们的结果揭示了一个单一的问题，其有两个等价形式，构成了几乎所有目前占据$O(n\sqrt{\log n})$硬度级别的主要问题的难点所在。这些结果极大地缩小了改进接近线性问题复杂性的进一步努力方向。作为我们框架的一个辅助结果，我们还证明了在若干中心字符串问题中，字母表可以被高效地减少到二进制。

数据结构与算法

2025-03-26 发布

考虑到非平稳性、单位间（空间）干扰以及残留效应（时间干扰）下的实验场景，我们希望估计总体平均处理效果（GATE），即所有单元在所有时间点均暴露于处理或对照条件下的平均结果差异。假设空间干扰由图描述，单元的结果依赖于其邻域的处理情况，而时间干扰由马尔可夫决策过程（MDP）描述，且两种处理（动作）下的转移核满足快速混合条件。我们提出了一种聚类切换设计，即将单元分组为簇，时间步分组为块，并对每个完整的簇-块组合分配单一随机处理。在此设计下，对于具有良好聚类的图，截断的Horvitz-Thompson估计器达到$\tilde O(1/NT)$的均方误差（MSE），在稀疏图的情况下匹配了理论下界（至对数项）。我们的结果同时推广了\citet{hu2022switchback,ugander2013graph}和\citet{leung2022rate}的研究成果。仿真研究验证了该方法的优越性能。

统计学理论

机器学习

统计理论

2025-03-26更新2023-12-25 发布

我们将磁图匹配的毕奥-萨伐尔定律（BSL）从平面几何推广到球面几何。对于给定的日冕电流密度$\bf{J}$，该定律确定了磁场$\tilde{\bf B}$，其径向分量在表面消失。将$\tilde{\bf B}$与由给定表面径向场$B_r$定义的位势场叠加，可以提供整个配置，其中$B_r$不受电流的影响保持不变。利用这种方法，我们（1）改进了用于构建日冕磁通绳（MFRs）的正则化BSLs，（2）提出了一种新的方法来分解测量的光球磁场为${\bf B} = {\bf B}_{\rm{pot}} + {\bf B}_T + {\bf B}_{\tilde{S}}$，其中位势场${\bf B}_{\rm{pot}}$、环形场${\bf B}_T$和偏心场${\bf B}_{\tilde{S}}$分别由$B_r$、$J_r$和${\bf B} - {\bf B}_{\rm{pot}}$的表面散度确定，所有这些都来源于磁数据。我们的${\bf B}_T$与Schuck等人（2022年）提出的高斯分解中的环形场相同，而${\bf B}_{\rm{pot}}$和${\bf B}_{\tilde{S}}$与其各自的偏心场${\bf B}_{\rm{P}<}$和${\bf B}_{\rm{P}>}$不同，后者分别在表面的上侧和下侧的无穷小邻域内是位势的。相比之下，我们的${\bf B}_{\tilde{S}}$没有这样的限制，并且像${\bf B}_{\rm{pot}}$和${\bf B}_T$一样，指的是表面的同一上侧。尽管存在这些差异，对于表面跨区连续分布的$\bf{J}$，${\bf B}_{\rm{pot}}$和${\bf B}_{\tilde{S}}$是${\bf B}_{\rm{P}<}$和${\bf B}_{\rm{P}>}$的线性组合。我们证明，类似于高斯方法，我们的分解允许识别太阳日冕中MFRs的足点和投影表面位置，以及它们电流的方向和连通性。

太阳和恒星天体物理学

2025-03-26更新2024-10-03 发布

大型语言模型（LLMs）在医疗领域中的应用日益广泛，但其可靠性受到用户驱动因素（如问题措辞和临床信息完整性）的极大影响。本研究探讨了误导性陈述框架、信息源权威性、模型人格设定以及关键临床细节的遗漏对LLMs诊断准确性和可靠性的影响。我们进行了两项实验：一项引入具有不同断言强度的误导性外部意见（扰动测试），另一项移除特定类别的患者信息（消融测试）。利用公共数据集（MedQA和Medbullets），我们评估了专有模型（GPT-4o、Claude 3.5 Sonnet、Claude 3.5 Haiku、Gemini 1.5 Pro、Gemini 1.5 Flash）和开源模型（LLaMA 3 8B、LLaMA 3 Med42 8B、DeepSeek R1 8B）。所有模型均对用户驱动的误导信息敏感，其中专有模型特别容易受到权威性语言的影响。断言性语气对准确性产生了最大的负面影响。在消融测试中，遗漏体格检查结果和实验室检测结果导致性能下降最为显著。尽管专有模型的基线准确性较高，但在存在误导信息的情况下其性能急剧下降。这些结果强调了结构化提示和完整临床背景的重要性。用户应避免对误导信息进行权威性表述，并提供完整的临床信息，特别是在复杂病例中。

我们研究了在高斯协变量双层模型下过参数化线性模型对多分类问题的渐近泛化性能，该模型由Subramanian等人在‘22年提出，其中数据点数量、特征数量和类别数量共同增长。我们完全解决了Subramanian等人提出的猜想，匹配了预测的泛化区间。此外，我们的新下界类似于信息论中的强逆结论：它们表明误分类率在渐近情况下趋近于0或1。我们结果的精确性带来了一个令人惊讶的后果，即在最小范数插值回归器已知为最优的区域中，最小范数插值分类器相对于非插值分类器在渐近情况下可能次优。我们分析的关键在于一种新的Hanson-Wright不等式变体，它对于稀疏标签的多分类问题具有广泛的应用价值。作为一种应用，我们展示了相同的分析方法也可以用于在相同的双层模型下分析相关的多标签分类问题。

机器学习

2025-03-26更新2023-06-23 发布

在TedX演讲中，Amber Huffman 激情呼吁“我们个人都不如所有人聪明”，并指出开源硬件是未来的发展方向。在软件质量提升方面，无论是开源还是闭源软件，持续集成和交付（CI/CD）系统设计方法论都做出了重要贡献，我们提议将其系统性地引入硬件设计及其规格说明中。为此，我们通过自动化的规格生成技术，利用“一种机器学习方法来发现形式化规格”的规范挖掘技术，极大地提升了软件工程师实现质量、验证和安全性能力。然而，将相同的技术应用于硬件并非易事。我们提出了一种通用的硬件规格设计持续集成（CI）技术，并持续部署（CD）硬件规格。作为一个概念验证，我们展示了Myrtha——一种基于现有硬件和软件质量工具的云基础规格生成器。

计算机硬件体系结构

2025-03-26更新2025-03-24 发布

设K为一个实代数数域，P为生成K的Pisot数的集合。我们证明了P-P中的元素是K的代数整数，并且在K的所有嵌入到C中的作用下（恒等映射除外），其模长均小于2。这一结果完善了Dubickas与第二作者之前的部分成果。此外，基于Minkowski关于紧致、凸对称体的定理，我们从该结果的证明过程中推导出了一些相关的已知结论。

数论

11R06(Primary), 11R04, 11J72

2025-03-26 发布

局域型原初非高斯性会在大尺度结构示踪体的聚集中产生一个独特项，在小波数 $k$ 处表现为 $k^{-2}$ 的行为。为了利用星系样本中的这一信号测量原初非高斯性的幅度 $f_{NL}$，我们需要独立确定退化偏倚系数 $b_\Phi$，该系数量化了星系数密度对物质聚集体振幅变化的对数响应。我们研究了 $b_\Phi$ 是否可以从星系数密度随红移演化的观测结果中估计出来。通过宇宙N体模拟，我们发现对于大规模结构巡天所使用的红移范围和暗晕质量范围内，$b_\Phi$ 可以相当好地估计出来。这包括暗晕浓度中的非高斯二次偏倚（或组装偏倚），此前已发现其幅度相当大。对于一个观测到的星系巡天，我们还需要考虑样本的选择函数，它可以通过视星等和颜色的限制在红移方向上引入依赖性。这些选择函数的影响可以通过进一步利用k校正后的视星等和颜色切割样本来减轻，从而仅保留那些在所考虑的红移区间内对所有红移都能满足目标选择标准的星系。

宇宙学和非星系天体物理学

2025-03-26 发布

虽然顺序决策环境常常涉及高维观测，但并非所有这些观测特征都与控制相关。特别是，观测空间可能捕获环境中由智能体无法控制的因素，但这些因素增加了观测空间的复杂性。为了在可处理的小状态空间中操作，需要忽略这些“噪声”特征，这对有效的策略学习提出了挑战。由于许多此类环境中存在丰富的视频数据，任务无关的无动作离线数据表征学习提供了一个有吸引力的解决方案。然而，近期的研究揭示了在存在时序相关的噪声特征的Exogenous Block MDP（Ex-BMDP）模型中无动作学习的理论局限性。为了解决这些局限性，我们确定了一个现实场景：当来自具有不同策略的多个智能体的无动作视频数据可用时，Ex-BMDP中的表征学习变得可行。具体而言，本文介绍了CRAFT（基于比较的无动作轨迹表征），这是一种样本高效的算法，利用跨智能体可控特征动态的差异来学习表征。我们为CRAFT的性能提供了理论保证，并在一个玩具示例中展示了其可行性，为类似设置中的实用方法奠定了基础。

机器学习

2025-03-26 发布

JWST观测结合HST数据有望改善附近旋涡星系中星团的年龄估计。然而，年轻星团恒星的反馈会将母体气体和尘埃推开，使星团的形成和演化建模变得困难。在此，我们利用JWST+HST对附近旋涡星系NGC 628的观测结果，构建了跨越275纳米至21微米范围的紧凑星团光谱能量分布（SED）模板。这些初步的SED捕捉了半径为0.12"至0.67"（对应NGC 628距离下的6至33秒差距）范围内的星团恒星及其相关的气体和尘埃。一个重要发现是，1、2、3和4百万年的星团在红外波段的SED可以区分。另一个重要发现是在我们研究的80%-90%的案例中，PAH和Hα发射彼此跟踪，导致3.3微米PAH发射的尘埃在4百万年后大部分被移除，这与超新星前恒星反馈快速作用于周围气体和尘埃一致。几乎嵌入的星团候选者具有与光学可见的1到3百万年星团相似的红外SED。在几乎所有情况下，我们发现几乎嵌入的星团附近几十分之一弧秒（10-30秒差距）内存在一个年轻的星团，表明该星团的形成是由其存在触发的。基于经验模板得出的年龄估计与基于CO超级气泡膨胀速度的动力学估计以及跟踪年轻星团周围均匀气体云球面演化的TODDLERS模型得出的结果相兼容。

星系天体物理学

2025-03-26更新2025-03-23 发布

曾有论点指出所谓的记忆负担效应可能导致黑洞因其所携带的信息而变得稳定，从而抑制霍金蒸发的发生率。此外还提出这开启了一个新的质量窗口，即在$10^{4}\,{\rm g} \lesssim M \lesssim 10^{10}\,{\rm g}$范围内，原初黑洞可能构成我们宇宙的暗物质。我们在本文中表明，这种可能性仅当黑洞从半经典阶段过渡到记忆负担阶段几乎是瞬时的情况下才成立。如果这一过渡过程更为连续，则在大爆炸核合成和复合时期，霍金蒸发仍将在相关水平上持续发生，从而导致严格的限制条件，排除了质量小于$\sim 4 \times 10^{16}\,{\rm g}$的黑洞能完全或大部分构成暗物质的可能性。

基础模型（FMs）作为一种有前景的时间序列预测方法已崭露头角。然而，由于在线学习计算成本较高，部署期间基础模型通常保持固定不变。因此，尽管有来自新到达数据的在线反馈，但部署的基础模型无法根据当前数据特征调整其预测结果。这引发了这样一个问题：是否可以通过高效利用这些反馈来提升模型性能？我们提出了AdapTS来回答这一问题。AdapTS是一种用于响应在线反馈调整基础模型预测的轻量级机制，它由两部分组成：a) AdapTS预测器，用于学习当前数据分布；b) AdapTS权重器，用于结合基础模型和AdapTS预测器的预测结果。我们在一系列标准时间序列数据集上评估了AdapTS与几种近期基础模型组合后的性能表现。在所有实验中，我们发现使用AdapTS确实能够提升性能。这项工作展示了如何通过有效利用在线反馈来改进基础模型的预测效果。

机器学习

2025-03-26更新2025-02-18 发布

高级基于人工智能的工具生成逼真图像的出现，给司法检测和来源归因带来了重大挑战，尤其是随着新生成技术的快速涌现。传统方法由于在训练过程中依赖于已知来源的特定特征，在泛化到未知生成器时往往表现不佳。为了解决这一问题，我们提出了一种新颖的方法，显式地建模司法微观结构——独特于图像创建过程的细微、像素级别的模式。仅使用真实图像以自监督的方式，我们学习一组多样化的预测滤波器，提取残差以捕捉这些微观结构的不同方面。通过跨多个尺度联合建模这些残差，我们得到了一个紧凑的模型，其参数构成了每幅图像独特的司法自描述。这种自描述使我们能够在没有先验知识的情况下，实现对合成图像的零样本检测、图像的开集来源归因以及基于来源的聚类。广泛的实验表明，我们的方法在准确性与适应性上优于竞争技术，推动了合成媒体取证领域的进步。

计算机视觉与模式识别

2025-03-26 发布

基于机器学习的模拟，特别是量能器模拟，是用极短的生成时间近似经典高能物理模拟精度的有前景工具。迄今为止几乎所有提出的方法都是通过神经网络将具有已知概率密度的随机变量（如高斯分布）映射到看起来真实的事件。然而在许多情况下，物理事件远离高斯分布，因此这些神经网络需要学习高度复杂的函数。我们研究了一种替代方法：基于薛定谔桥的快速量能器模拟质量改进（SQuIRELS）。SQuIRELS 利用基于扩散的神经网络和薛定谔桥的力量，在概率密度未知的情况下实现样本之间的映射。我们将 SQuIRELS 应用于精化经典快速模拟以逼近完整经典模拟的任务。在模拟的量能器事件中，我们发现 SQuIRELS 能够以极短的生成时间重现完整模拟的高度非平凡的特征。

仪器与探测器

高能物理-实验

高能物理-唯象学

2025-03-26更新2023-08-23 发布

共 13511 条搜索结果

共 13511 条

综述：生成式人工智能模型中的音频水印鲁棒性如何？

基于模糊逻辑的模型预测控制：整合最优与常识决策的范式

宇宙网：云环境中基于局部放大模拟的宇宙学初始条件

ALMA二维超级分辨率成像调查：猎户座I类/平谱/II类盘——I: 新盘亚结构的发现

VideoHandles：利用视频生成先验编辑视频中3D对象组成

主序星之外：Gaia时代的双星演化路径到蓝离散星 II. 银河系疏散星团和球状星团

关于Word RAM模型中$O(n \sqrt{\log n})$复杂度的硬度层次研究

面向时空干扰下实验设计的聚类切换设计

磁图匹配的毕奥-萨伐尔定律及矢量磁图分解

大型语言模型在医疗查询中受用户驱动因素影响的易感性研究

过参数化线性模型多分类的精确渐近泛化研究

“测试、构建、部署”——开源硬件设计的CI/CD框架

关于生成相同数域的Pisot数距离的刻画

利用示踪体计数估计非高斯偏倚

通过比较多样化数据集的离线无动作Ex-BMDP学习

基于哈勃空间望远镜（HST）和詹姆斯·韦布空间望远镜（JWST）观测的星团经验SED模板：五百万年后强多环芳烃或红外尘埃发射不显著

记忆负担效应是否为原初黑洞作为暗物质开启新的质量窗口？

时间序列基础模型预测的轻量级在线自适应方法

只需司法自描述即可实现对AI生成图像的零样本检测、开集来源归因和聚类

基于薛定谔桥精化快速量能器模拟