Research

arXiv

分类

我们研究了由Angluin、Aspnes、Diamadi、Fischer和Peralta（2004）引入的群体协议模型中的自稳定精确多数问题。在这个模型中，有$n$个状态机，称为代理，它们构成一个网络。在每个时间步长中，只有两个代理相互交互并更新其状态。在自稳定精确多数问题中，每个代理有一个固定意见，$\mathtt{A}$或$\mathtt{B}$，并且从任何初始配置开始，所有代理都会稳定到一个安全配置，在该配置下所有代理都输出多数意见。本文证明了在不知道$n$的情况下，任何协议都无法解决自稳定精确多数问题。我们提出了一种无声的自稳定精确多数协议，该协议期望在$O(n)$并行时间内稳定，并且以高概率在$O(n \log n)$并行时间内稳定，使用$O(n)$状态，并且需要知道$n$。这里，无声协议意味着在稳定后，每个代理的状态不会改变。我们还建立了下界，证明任何无声协议达到安全配置都需要$\Omega(n)$状态，$\Omega(n)$期望并行时间和$\Omega(n \log n)$高概率并行时间。因此，所提出的协议在时间和空间上都是最优的。

分布式、并行与集群计算

2025-03-22 发布

自然语言视频定位（NLVL）是视频理解中的重要任务，旨在通过给定的语言描述确定视频中的目标时刻。近期，提出了一种基于点标注的范式来解决该任务，只需在目标时刻内标注一个单一帧，而无需完整的时序边界。与全监督范式相比，它在定位准确性和标注成本之间实现了平衡。然而，由于缺乏完整标注，难以对齐视频内容与语言描述，从而阻碍了准确时刻预测。为了解决这一问题，我们提出了一个新的协作时序一致性学习（COTEL）框架，利用显著性检测与时刻定位之间的协同效应加强视频-语言对齐。具体而言，我们首先设计了帧级和片段级时序一致性学习（TCL）模块，用于建模帧显著性与句子-时刻对之间的语义对齐。然后，设计了交叉一致性引导方案，包括帧级一致性引导（FCG）和片段级一致性引导（SCG），使两条时序一致性学习路径相互强化。此外，引入分层对比对齐损失（HCAL），全面对齐视频和文本查询。在两个基准数据集上的大量实验表明，我们的方法优于现有的最先进方法。我们将发布所有源代码。

计算机视觉与模式识别

2025-03-22 发布

参数高效微调（PEFT）已成为一种重要的方法，用于在不承担全量微调高昂计算成本的情况下，将大型视觉Transformer适应到下游任务中。尽管现有的视觉提示调优（VPT）方法取得了显著进展，但它们大多依赖于静态的、领域特定的提示，无法捕捉单个样本中的丰富视觉多样性。本文介绍了一种名为V$^2$APT（视觉变分自编码器提示调优）的新框架，该框架利用变分自编码器架构生成动态的、输入相关的提示。通过学习图像特定特征的潜在表示并将其解码为定制化的提示，V$^2$APT能够适应每个输入的独特视觉特性。在FGVC、HTA和VTAB-1k基准数据集上的大量实验表明，我们的方法始终优于最先进的PEFT方法。特别是，V$^2$APT在HTA上的表现比VPT-Deep高出+3.2%，在三个数据集上的平均性能提升为+2.0%。

计算机视觉与模式识别

2025-03-22 发布

背景：肺病是重要的健康问题，特别是在儿童和老年人中。它通常由肺部感染引起，是儿童死亡的主要原因之一。全球每年因肺部相关疾病导致许多生命丧失，因此早期且准确的诊断至关重要。放射影像学是诊断此类病症的重要工具。最常见的肺部疾病包括肺炎、哮喘、过敏、慢性阻塞性肺病（COPD）、支气管炎、肺气肿和肺癌，这些构成了重要的公共卫生挑战。早期预测这些疾病至关重要，因为它可以识别风险因素并采取预防措施以降低发病的可能性。方法：本研究利用了一个包含3,475张胸部X光图像的数据集，该数据集来源于Talukder, M. A. (2023)提供的Mendeley Data，分为三类：正常、肺部浸润和肺炎。我们应用了五种预训练的深度学习模型，包括CNN、ResNet50、DenseNet、CheXNet和U-Net，以及两种迁移学习算法，即视觉Transformer（ViT）和窗口位移（Swin），用于对这些图像进行分类。这种方法旨在通过减少对人工干预的依赖，通过自动化分类系统解决肺部异常的诊断问题。我们的分析在二分类和多分类设置下均进行了评估。结果：在二分类中，我们专注于区分正常和病毒性肺炎病例；而在多分类中，包含了所有三类（正常、肺部浸润和病毒性肺炎）。我们提出的ViT方法表现出色，在二分类中达到了99%的准确率，在多分类中达到了95.25%的准确率。

我们提出了一种策略平均方法（Policy Averaging Approach, PAA），该方法综合了现有方法的优点，为随机优化问题构建更可靠、灵活且有据可依的策略。PAA的一个重要组成部分是风险多样化，以减少策略的随机性。另一个组成部分模仿统计学中的模型平均技术。第三个组成部分涉及利用交叉验证来多样化并优化候选策略之间的权重。我们展示了PAA在报童问题中的应用。对于这一问题，基于模型的方法通常依赖于独立同分布（i.i.d.）需求或特征相关需求的特定且可能不可靠的假设，而数据驱动的方法，包括样本平均和利用协变量函数设定订购量，往往存在过拟合问题，并对推荐策略的合理性提供有限见解。通过整合统计学和金融学的概念，PAA避免了这些问题。通过理论分析、模拟研究和实证研究，我们证明PAA优于上述早期方法。PAA展示出的好处包括降低期望成本、提高性能稳定性以及改善对推荐策略合理性的见解。此外，还讨论了考虑尾部风险和分层抽样的扩展方法。除了报童问题，PAA还可广泛应用于不确定性条件下的各种决策问题。

应用

2025-03-22 发布

深度神经网络（DNN）已被广泛应用于包括安全关键系统在内的各个领域，因此需要进行全面的测试以确保其可靠性。尽管已提出了许多用于生成能够揭示故障的对抗样本的DNN模型测试方法，但现有方法通常是在输入空间中扰动样本，然后基于DNN模型反馈对这些样本进行变异。这些方法生成的测试样本往往不现实，且揭示故障的概率较低。为了解决这些局限性，我们提出了一种黑盒DNN测试输入生成方法ARGUS，用于生成逼真、多样且能揭示故障的测试输入。ARGUS首先将样本压缩到连续的潜在空间中，然后通过将这些样本与不同类别的样本进行插值来扰动原始样本。随后，我们采用向量量化器和解码器将对抗样本重构回输入空间。此外，我们在潜在空间和输入空间中都采用了判别器，以确保生成样本的真实性。与最先进的黑盒测试方法和白盒测试方法相比，ARGUS的评估结果显示，ARGUS在生成针对目标数据集的逼真且多样的对抗样本方面表现出色，并且ARGUS成功扰动了所有原始样本，达到了比最佳基线方法高出4倍的错误率。此外，使用这些对抗样本进行模型再训练可以提高模型的分类准确性。

机器学习

软件工程

2025-03-22 发布

尽管团队在产生创新性和高影响力的科学和技术成果方面的重要性日益增加，但关于团队成员间专业多样性的程度如何影响其产出工作的原创性和影响力仍不清楚。在此，我们开发了一种新方法，基于研究人员的职业历史量化他们的专业知识距离，并将其应用于2300万篇科学论文和400万项专利。我们发现，在科学和技术领域，专业知识多样化的团队往往能产出更具原创性的成果。拥有更多元化专业知识的团队在短期（2年）或中期（5年）并没有显著的优势。然而，它们在长期（10年）表现出更高的影响力，并逐渐吸引更大的跨学科影响力。当其他维度的团队多样性缺失时，这种团队成员间专业知识多样性的影响力溢价尤为明显，因为同一机构或国家内部的团队似乎更倾向于从专业知识多样性中获益。尽管性别多样性团队的平均影响力相对较高，但具有不同性别多样性水平的团队似乎都从增加的专业知识多样性中受益。鉴于当前对个人研究者知识需求的增长、对原创研究激励的需求以及短期和长期影响之间的权衡，这些结果可能对资助、组建和保持具有原创性和持久影响力的研究团队具有重要意义。

物理与社会

数字图书馆

2025-03-22更新2022-10-10 发布

上述中频段（4–24 GHz）的全球分配需要全面探索传播特性，以满足覆盖范围和容量的要求。本文介绍了在美国布鲁克林市中心进行的一项针对6.75 GHz和16.95 GHz频段的城市微小区（UMi）户外传播测量活动。该测量活动使用了带宽为1 GHz的滑动相关信道探测器，覆盖了40–880米的传播距离，并包括7个视距（LOS）位置和13个非视距（NLOS）位置。路径损耗（PL）分析表明，在UMi环境中，使用1米参考距离的近似自由空间路径损耗（FSPL）模型时，方向性和全向路径损耗指数均低于毫米波和亚太赫兹频率。此外，观察到均方根（RMS）时延扩展（DS）和角度扩展（AS）随频率增加而呈下降趋势。所测得的NLOS RMS DS和RMS AS平均值（按3GPP方法计算）被发现始终低于3GPP模型预测值。为支持这些模型和结果，提供了每个发射机-接收机（TX-RX）位置的所有统计数据对应的点数据表及其特定环境信息。此处呈现的空间-时间统计为下一代无线系统和网络的设计提供了宝贵的见解。

信号处理

2025-03-22更新2024-10-23 发布

本文提出了一种用于计算由非线性偏微分方程空间离散化产生的非线性矩阵方程低秩解的新框架：低秩Anderson加速（lrAA）。lrAA是对Anderson加速（AA）的一种适应，AA是一种已知的求解非线性不动点问题的方法，被调整为低秩格式。具体来说，lrAA在低秩形式下执行所有的线性和非线性运算，并通过自适应截断容差进行秩截断。我们提出了一种简单的调度策略，根据残差指示器在整个迭代过程中更新截断容差，从而有效控制中间秩和迭代次数。为了对非线性函数进行秩截断，我们提出了一个新的交叉逼近方法，称为基于离散经验插值方法（DEIM）的交叉逼近（Cross-DEIM），并采用自适应误差控制。Cross-DEIM在近似奇异值分解（SVD）和交叉逼近之间进行迭代更新，自然地为每次lrAA迭代引入了热启动策略。我们展示了lrAA在一系列线性和非线性问题上的优越性能，包括来自Laplace方程、Bratu问题、椭圆Monge-Ampère方程和Allen-Cahn方程有限差分离散化的例子。

数值分析

cs.NA

2025-03-22更新2025-03-05 发布

我们提出了求解单位球面上刚性微分方程的隐式积分方法。我们的方法通过引入单位球体固有的几何约束，扩展了笛卡尔空间中的标准向后欧拉法和Crank-Nicolson法，而无需额外的投影步骤来强制解的单位长度约束。我们利用单位球体上的指数映射和球面线性插值（SLERP）公式构建这些算法。具体而言，我们介绍了球面向后欧拉法、投影向后欧拉法以及二阶辛球面Crank-Nicolson法。尽管所有方法都需要求解非线性方程组以推进到下一时间步，但可以通过牛顿迭代高效地解决这些非线性系统。我们将展示多个数值例子，以证明这些数值方案的有效性和收敛性。这些例子将说明所提出方法在准确捕捉单位球面上刚性系统的动力学方面的优势。

数值分析

cs.NA

2025-03-22 发布

内在动机和奖励形状化通过添加伪奖励来引导强化学习（RL）代理，这可以产生有用的新兴行为。然而，它们也可能鼓励反生产的行为，例如对噪声电视屏幕的沉迷。在这里，我们提供了一个理论模型，预测这些行为，并在其中提供广泛的准则，以限制不利影响。我们将所有伪奖励表征为 Bayes-自适应马尔可夫决策过程（BAMDPs）中的奖励形状化，这将MDPs中的学习问题表述为关于代理知识的MDP。最优探索最大化BAMDP状态价值，我们将其分解为信息收集的价值和物理状态的先验价值。伪奖励通过奖励增加这些价值成分的行为来指导RL代理，而当它们与实际价值不一致时，则会阻碍探索。我们将基于潜力的形状理论扩展，证明BAMDP 基于潜力的形状函数（BAMPFs）在元强化学习中对奖励黑客攻击具有免疫力（收敛到最大化复合奖励的行为，从而损害真实奖励），并展示一个BAMPF如何帮助元RL代理在伯努利多臂老虎机领域学习最佳RL算法。最后，我们证明具有有界单调递增潜力的BAMPFs在常规RL设置中也抵抗奖励黑客攻击。我们展示了以这种形式重新设计或设计新的伪奖励项是简单的，并在Mountain Car环境中提供了实证演示。

机器学习

人工智能

2025-03-22更新2024-09-09 发布

我们引入了一种统计框架，用于结合多个大型纵向心血管队列的数据，从而能够从早期成年期开始研究长期的心血管健康状况。利用隶属于终身风险池项目（LRPP）的七个队列的数据，我们提出了一种贝叶斯分层多变量方法，该方法联合对多个纵向风险因素随时间和队列的变化进行建模。由于我们的项目中很少有队列覆盖整个成年生命周期，因此我们的策略利用所有风险因素的信息提高每个风险因素轨迹的精确度，并在队列间借用信息填补未观察到的风险因素。我们开发了新的诊断测试和模型验证方法，以确保模型能够稳健地捕捉并维持随时间推移以及跨风险因素的关键关系。

方法论

应用

2025-03-22 发布

在本文中，我们基于近期在文献[1]中的发现，进一步分析了广义相对论中已知的球对称静态黑洞跳跃解在度规形式的f(R)理论框架下的推广。我们发展了一种一般方法，用于确定任何模型的源，其中f(R) = R + H(R)，前提是广义相对论中跳跃度规对应的源已知。结果表明，当考虑f(R)引力与非线性电磁学以及部分幻影标量场的耦合时，可以从该理论中得出黑洞跳跃解。此外，我们还分析了这些解的能量条件，并发现与广义相对论不同，在时空的某些区域可以满足所有能量条件。

广义相对论与量子宇宙学

2025-03-22更新2025-02-26 发布

全科医生（GPs）通过提供连续且全面的医疗服务，成为初级医疗保健系统的核心。然而，由于其社区导向的实践特性、培训资源分布不均等原因，不同地区和医疗环境中全科医生的临床能力可能存在显著差异。目前，大型语言模型（LLMs）在临床和医学应用方面展现出巨大潜力，成为支持全科医疗的有前景工具。然而，大多数现有的基准和评估框架主要集中在考试式的评估——通常是多项选择题，缺乏能够准确反映全科医生实际工作场景的综合评估集。为评估LLMs在全科医生日常工作中决策的有效性，我们设计了GPBench，该基准不仅包含来自临床实践的测试题目，还提出了一个全新的评估框架。测试集包括评估全科医学基础知识的多项选择题，以及基于真实情景的问题。所有问题均由专家精心注释，包含丰富的细粒度信息，涉及临床管理相关内容。提出的LLM评估框架基于全科医学能力模型，为评估LLMs在现实世界中的表现提供了全面的方法学。作为首个针对全科医生决策场景的大模型评估集，GPBench使我们能够评估当前主流LLMs的表现。专家评估表明，这些模型在疾病分期、并发症识别、治疗细节和用药使用等领域至少存在十大主要不足。总体而言，现有LLMs在没有人工监督的情况下尚不适合独立应用于现实世界的全科医生工作场景。

计算与语言

人工智能

2025-03-22 发布

动态分析，通过重定位技术，是嵌入式系统软件安全性评估的重要能力。现有的重定位技术旨在通过精确模拟硬件和外设交互提供高保真度执行。然而，由于可用外设数量的增加以及为多样化硬件设计仿真模型所涉及的复杂性，这些技术在实际应用中面临诸多挑战。此外，与现有工作的指导信念相反，我们对已报告漏洞的分析表明，暴露大多数嵌入式软件中的漏洞并不需要高保真度执行。我们的核心假设是安全漏洞更可能出现在较高的抽象层次上。为了验证这一假设，我们引入了LEMIX框架，该框架通过将嵌入式应用重定位为脱离硬件依赖的x86 Linux应用，从而实现动态分析。使嵌入式应用能够在Linux上原生运行，有助于利用现有的分析技术和Linux平台强大的硬件资源提高测试吞吐量。我们开发了多种技术以解决将嵌入式应用转换为Linux应用时遇到的各种挑战。我们在四个实时操作系统（RTOS）下的18个真实世界嵌入式应用上评估了LEMIX，发现了12个应用中的21个新漏洞以及全部4个RTOS内核中的漏洞。结果表明，LEMIX在代码覆盖率（约提升2倍）和漏洞检测（多发现18个漏洞）方面均优于现有的最先进方法。

我们研究了双尺度SYK模型中由双侧弦哈密顿量所支配的时间演化，这在双尺度代数中的算符上诱导出一个概率分布。通过体-边界映射，这一分布转化为弦希尔伯特空间内态的动力学剖面。我们推导出了这些剖面的解析表达式，其适用范围广泛，并涵盖所有时间尺度。此外，我们展示了如何通过在半经典极限下的特定能量区域内局域化来产生不同的半经典行为。我们重新审视了加倍希尔伯特空间形式主义，即弦希尔伯特空间的一粒子扇区与加倍零粒子扇区之间的等距映射。利用这一映射，我们得到了关联函数的解析结果并探讨了弦算符的动力学演化。具体而言，我们建立了存在物质弦时弦数目生成函数与交错四点关联函数之间的等价关系，后者与$ U_{\sqrt{q}}(\mathfrak{su}(1,1)) $的$ 6j $符号密切相关。我们还探索了有限温度效应，表明随着温度降低，算符扩散减缓。在半经典极限下，我们进行了驻点分析并结合一环行列式，得到了无限温度下单圈时间有序四点关联函数的归一化表达式，其中主要修正项重现了大-$ p $ SYK模型中观察到的$ 1/N $连接贡献。最后，我们在三重尺度下考察了存在物质时总弦数的时间演化，将其与具有物质的JT引力中的重整化双侧长度联系起来。

2025-03-22更新2024-11-06 发布

提出了一种用于线性零幂系统时间最优反馈控制律综合的计算方法。该方法基于bang-bang定理的应用，将时间最优轨迹表征为依赖参数的多项式系统以描述控制切换序列。随后应用去膨胀牛顿法穷尽多项式系统的全部实根。此根搜索过程借助Hermite二次型进行指导，提供了关于需寻找实根数量的精确估计。在论文的第二部分，对多项式系统进行采样并求解以生成合成数据集，通过监督学习构建时间最优深度神经网络——将其解释为二分类器。在维度递增的积分器上的数值测试评估了近似控制律的精度、鲁棒性和实时控制能力。

优化与控制

机器学习

2025-03-21 发布

我们将Reiner--Saliola--Welker所提出的著名的“*$k$-随机到随机洗牌*”这一神秘的马尔可夫链家族从对称群上的马尔可夫链推广到了Type-$A$ Iwahori--Hecke代数上的马尔可夫链。我们证明了该算子族两两交换，并且其特征值是$q$的多项式，且系数为非负整数。我们的工作推广了Reiner--Saliola--Welker以及Lafreni\`ere对于对称群的工作，并简化了在此情形下已知的所有证明。

组合学

环与代数

表示论

20C08, 20C30, 60J10, 05E10

2025-03-21 发布

具有时窗的路由和调度问题长期以来一直是物流和规划中的重要优化问题。针对此类问题存在许多经典的启发式方法和精确方法。然而，由于两个主要原因，利用量子计算（QC）生成路径的方法仍不令人满意：不等式约束以及可行解与解质量之间的权衡。通常通过松弛变量处理不等式约束，并通过对样本进行过滤找到可行解。这些挑战在量子计算固有的噪声环境下被进一步放大。在此，我们提出了一种贪婪算法，该算法通过利用从量子计算机获得的所有样本的信息来生成路径。注意到我们公式中比特之间的关系可以表示为有向无环图（DAG），我们设计了一种自适应构建可行解的算法。我们证明了其收敛到可行解，并通过求解带时窗的车队规模车辆路径问题（FSVRPTW）展示了其有效性。我们的计算结果显示，对于相同的时间内使用D-Wave Hybrid Solver，这种方法得到的目标函数值低于当前最先进的经典和混合退火方法。此外，我们还通过计算结果展示了其对D-Wave Advantage2上的噪声的鲁棒性，即使与在DWaveSampler上使用过滤方法相比，后者具有更长的退火时间和更大的样本量。

量子物理

cs.SY

系统与控制

2025-03-21更新2024-05-05 发布

联邦学习（FL）容易受到定向投毒攻击的威胁，这种攻击旨在特定地导致源类别到目标类别的误分类。然而，利用已建立的防御框架，可以大大减轻这些攻击的投毒影响。我们引入了一种广义的预训练阶段方法来增强针对FL的定向投毒攻击，称为BoTPA。其设计原理是利用所有数据点（包括源类和目标类之外的数据点）的模型更新贡献，构建一个放大器集合，在联邦学习训练过程之前伪造数据标签，以此来增强攻击效果。我们全面评估了BoTPA在各种定向投毒攻击下的有效性和兼容性。在数据投毒攻击下，我们的评估结果显示，与基线相比，BoTPA在不同源目标类别组合以及不同恶意客户端比例的情况下，实现了中位数相对攻击成功率提升（RI-ASR）介于15.3%至36.9%之间；在模型投毒攻击情境下，面对Krum和Multi-Krum防御时，BoTPA的RI-ASR范围为13.3%至94.7%，在Median防御下为2.6%至49.2%，在Flame防御下为2.9%至63.5%。

密码学与安全

机器学习

2025-03-21更新2024-07-13 发布

共 13511 条搜索结果

共 13511 条

时间与空间最优的无声自稳定精确多数协议在群体协议中的研究

基于点标注的自然语言视频定位协作时序一致性学习

视觉变分自编码器提示调优

使用视觉Transformer进行肺部疾病自动诊断：胸部X光分类的对比研究

集体智慧：基于策略平均的方法及其在报童问题中的应用

基于潜在空间插值生成逼真、多样且能揭示故障的深度神经网络测试输入

团队成员的专业多样性预测科学与技术的原创性和长期影响力

5G和6G在4–24 GHz频段上的城市户外传播测量与信道模型（FR1(C)和FR3高频段）

低秩Anderson加速算法（lrAA）

基于指数映射和球面线性插值的球面Crank-Nicolson积分器

BAMDP 形状化：内在动机与奖励形状化的统一框架

结合纵向队列研究探讨成年生命周期中心血管风险因素轨迹

f(R)引力中的广义黑洞跳跃解及其场源

GPBench：全面且细致的大型语言模型作为全科医生评估基准

LEMIX：使嵌入式应用作为Linux应用进行测试成为可能

双尺度SYK模型中弦动力学与复杂性增长的研究

零幂系统时间最优神经反馈控制作为二分类问题的研究

Hecke代数中$q$-变形随机到随机算子族的研究

一种贪婪的量子路径生成算法

同伙作案：提升针对联邦学习的定向投毒攻击