分类
一切所需唯有莎莉-安:超越三岁儿童测试后,人工智能中的心智理论得到强力支持
心智理论(ToM)是人类认知的标志性特征,使个体能够推理他人的信念和意图。近期在人工智能(AI)领域取得进展的工程师们声称已展示出可比的能力。本文介绍了一种超越为三岁儿童设计的传统ToM测试的模型,为人工智能系统中存在ToM提供了强有力的支撑。
通过奇异元素数量刻画$\PSL(2,q)$
设$G$为一个有限群,令$\pi(G)$表示整除$G$阶的所有素数的集合。对于素数$r\in\pi(G)$,我们定义$r$-奇异元素为那些阶能被$r$整除的$G$中的元素。记$G$的$r$-奇异元素个数为$S_r(G)$。我们用${\mu_r}(G)=S_r(G)/|G|$表示$G$中$r$-奇异元素的比例。设$\mu(G):={\{\mu_r}(G)|r\in\pi(G)\}$为$\pi(G)$中每个素数$r$对应的$r$-奇异元素比例的集合。本文证明了:若有限群$G$的$\mu(G)$集合与单群$\PSL(2,q)$相同,则$G$与$\PSL(2,q)$同构。
Finer-CAM:通过发现差异揭示更精细的视觉解释细节
类激活图(CAM)已被广泛用于突出对类别预测有贡献的图像区域。尽管其简单且计算高效,CAM往往难以识别区分视觉相似细粒度类别的判别区域。此前的努力通过引入更复杂的解释过程来解决这一局限性,但付出了额外复杂性的代价。本文提出Finer-CAM方法,在保持CAM效率的同时实现了判别区域的精确定位。我们的核心见解在于CAM的不足不在于“如何”解释,而在于“解释什么”。具体而言,先前的方法试图识别所有有助于目标类别logit值的线索,这无意中也激活了与视觉相似类别的预测区域。通过显式比较目标类别与其他类别并发现它们之间的差异,Finer-CAM抑制了与其他类别共享的特征,并强调了目标类别的独特判别细节。Finer-CAM易于实现,兼容多种CAM方法,并可扩展到多模态模型以实现特定概念的准确定位。此外,Finer-CAM允许调整比较强度,使用户可以选择性地突出粗略物体轮廓或精细判别细节。定量分析表明,通过Finer-CAM屏蔽掉激活像素的前5%,相对置信度下降幅度比基线更大。源代码和演示可在https://github.com/Imageomics/Finer-CAM获取。
Hilbert空间上线性Gaussian反问题的最优低秩近似,第二部分:后验均值近似
在这项工作中,我们构建了线性Gaussian反问题中高斯后验分布的最优低秩近似。参数空间为可能具有无限维的可分Hilbert空间,数据空间假设为有限维。我们考虑了后验分布的各种近似族。首先,我们考虑近似后验,其中均值在数据的结构保持或忽略的低秩变换类中变化,而后验协方差保持固定。我们给出了这些近似后验与精确后验同时对所有可能的数据实现都等价的必要且充分条件。对于这些近似,我们使用Kullback-Leibler散度、Rényi散度($\alpha \in (0,1)$)以及Amari $\alpha$-散度和Hellinger距离来衡量平均意义上的近似误差,并对数据分布进行平均。在这些损失函数下,我们找到了最优的近似并提出了其唯一性的等价条件,扩展了Spantini等人在有限维情况下(SIAM J. Sci. Comput. 2015)的工作。然后,我们通过后验协方差也变化到第一部分中考虑的低秩更新形式,研究了均值和协方差的同时近似。对于反向Kullback-Leibler散度,我们证明了分别优化的均值和协方差的近似可以组合成均值和协方差的联合最优近似。此外,我们将均值为最优结构忽略形式的联合近似解释为参数空间中的一个最优投影器。
基于可泛化图神经网络的大规模网络流量工程
随着全球范围云广域网或低地球轨道卫星星座的快速发展,大规模计算机网络中的流量工程(TE)已成为一个基础但具有挑战性的问题。为了解决传统TE算法的可扩展性问题,提出了基于学习的方法,显示出相对于现有最优方法显著的效率提升潜力。然而,现有基于学习的方法存在固有局限性,限制了其实际应用:它们无法在不同的拓扑结构和网络条件下通用,训练开销过大,并且默认情况下不尊重链路容量。本文提出了一种新的TE算法TELGEN,该算法能够在大规模网络中高效解决TE问题,同时在多样化的网络条件下表现出优越的泛化能力。TELGEN基于一种新颖的思想,即将“预测最优TE解决方案”的问题转化为“预测最优TE算法”的问题,这使得TELGEN能够学习并有效地逼近经典最优TE算法的端到端求解过程。所学得的算法对具体的网络拓扑或流量模式无依赖性,并且可以在任意输入下高效解决TE问题,并很好地推广到未见过的拓扑和需求。我们在随机和真实网络上训练和评估了TELGEN,这些网络最多包含5000个节点和106条链路。TELGEN在所有情况下保证可行性的同时,优化差距小于3%,即使测试网络的节点数量比训练集中的最大网络多出20倍。它还比经典的最优求解器节省高达84%的求解时间,并且在最大的网络上相比最新的学习算法,每轮训练时间和求解时间减少了2到4个数量级。
反向Littlewood--Offord问题中的双跳跃相变
Erdős在1945年猜测,对于$\mathbb{R}^2$中任意单位向量$v_1, \dotsc, v_n$以及独立均匀取值于$\{-1,1\}$的符号$\varepsilon_1, \dotsc, \varepsilon_n$,随机Rademacher和$\sigma = \varepsilon_1 v_1 + \dotsb + \varepsilon_n v_n$满足$\|\sigma\|_2 \leq 1$的概率为$\Omega(1/n)$。虽然该猜想对偶数$n$不成立,但Beck证明了$\|\sigma\|_2 \leq \sqrt{2}$总是成立,且概率为$\Omega(1/n)$。最近,He、Juškevičius、Narayanan和Spiro猜测该猜想对奇数$n$成立。我们通过构造向量$v_1, \dotsc, v_n$证明了$\|\sigma\|_2 \leq 1$发生的概率仅为$O(1/n^{3/2})$,从而否定了这一猜测。另一方面,其近似版本成立:我们证明了对于所有$\delta > 0$,总存在$\Omega_\delta(1/n)$的概率使得$\|\sigma\|_2 \leq 1 + \delta$成立。这表明当$n$为奇数时,$\|\sigma\|_2 \leq r$的最小概率在$r=1$处出现双跳跃相变,因为我们还可以证明$\|\sigma\|_2 \leq 1$发生的概率至少为$\Omega((1/2+\mu)^n)$,其中$\mu > 0$。此外,使用不同的构造方法,我们回答了Beck提出的一个问题以及He、Juškevičius、Narayanan和Spiro提出的另外两个问题,这些问题涉及使$\|\sigma\|_2 \leq \sqrt{2}$的概率最小化的最优构造。我们还对这些问题的高维版本取得了一些进展。
费米实验室向令牌认证的过渡
费米实验室是第一家从X.509用户证书转向生产系统中认证令牌的高能物理研究机构。费米实验室托管的所有实验现在都在其网格作业中使用JSON Web Token (JWT)访问令牌。为了实现这一转变,许多软件组件已被更新或创建,其中大部分软件已作为开源提供给其他人。这些令牌按照WLCG通用JWT配置文件定义,所有令牌的属性存储在费米实验室的FERRY系统中,该系统生成CILogon令牌发行方的配置。高安全价值的刷新令牌存储在由htvault-config配置的Hashicorp Vault中,而JWT访问令牌通过htgettoken客户端与其HTCondor集成请求获取。费米实验室的作业提交系统jobsub被重新设计为HTCondor的一个轻量级包装器。基于HTCondor的网格工作负载管理系统GlideinWMS也进行了更新,以使用令牌进行飞行员作业提交。对于自动化作业提交,创建了一个受管理的令牌服务,以减少重复工作和对如何安全地保持令牌活动的知识需求。现有的费米实验室文件传输工具ifdh以及用于管理和自动作业提交的POMS(生产操作管理系统)和用于通过CernVM文件系统分发分析代码的RCDS(快速代码分发系统)都已更新,以无缝支持令牌。dCache存储系统重新配置为接受令牌进行身份验证,而不是X.509代理证书。由于某些服务和站点尚未实现令牌支持,作业仍会携带代理证书以确保向后兼容,但一些实验已经开始逐步停止使用它们。
顶点着色的Wiener指数
图的一个顶点着色的Wiener指数被定义为同一颜色顶点之间的所有成对测地线距离之和。我们针对路径和圈的顶点着色,提供了在各种自然集合中Wiener指数尽可能大的刻画。在此过程中,我们建立了整数元组上的主序关系与路径和圈的顶点着色的Wiener指数之间的联系。
分布式分数贝叶斯学习在自适应优化中的应用
本文研究了一个分布式自适应优化问题,其中所有代理只能访问其局部代价函数以及一个公共未知参数,而它们的目标是在连接网络中协同估计真实参数并找到最优解。目前尚未有针对此类问题的一般数学框架。我们旨在为解决分布式优化问题中的参数不确定性提供有价值的见解,并同时找到最优解。因此,我们提出了一种新颖的边预测边优化方案,该方案通过在对数信念上的加权平均利用分布式分数贝叶斯学习来更新未知参数的信念,并采用分布式梯度下降法来更新最优解的估计。然后,在合适假设下,我们证明了所有代理的信念和决策变量几乎肯定收敛到真实参数和真实参数下的最优解。我们进一步建立了信念序列的次线性收敛率。最后,通过数值实验验证了理论分析。
利用渐近匹配技术研究接近理想稳定性边界的撕裂模稳定性
文档记录了对TJ环形撕裂模代码([Phys. Plasmas 31, 102507 (2024)])的一些改进,并成功将该代码与STRIDE环形撕裂模代码([Phys. Plasmas 25, 082502 (2018)])进行基准测试。最后,利用TJ代码的新功能,研究了当接近与外部-扭结模或内部-扭结模相关的理想稳定性边界时,托卡马克等离子体中的撕裂模稳定性。发现当接近理想稳定性边界时,撕裂稳定性矩阵的所有元素都趋于无穷大。此外,随着稳定性边界的接近,通过剪切等离子体旋转解耦的等离子体中各种撕裂模的特征函数都被发现会转化为临界稳定的理想模的特征函数。然而,各种“理想-撕裂模”的增长率和真实频率彼此不同。而且,重新连接靠近等离子体边缘的理性表面磁通的理想-撕裂模的增长率在接近稳定性边界时趋于一个非常大的值。描述并验证了一种相对简单的理想稳定性检测方法,即使在存在非常贴合的理想壁的情况下,也能检测外部-扭结模和内部-扭结模的稳定性边界。
二十一世纪全球天体测量的计算挑战
空间科学和探测器技术的重大进步为银河系及局部宇宙中恒星距离和运动的测量——即全球天体测量学——带来了革命性的变化。从上世纪80年代初欧洲航天局(ESA)的第一个天体测量任务“依巴谷”(HIPPARCOS)到目前的“盖亚”(Gaia)任务,整个数据处理过程的数据量和计算复杂度提高了几个数量级,这要求高性能计算和高吞吐量的数据处理能力。我们回顾了导致对超大规模且高度非线性估计问题进行统计处理的一般全球天体测量模型的基本原理及其计算复杂性。此外,还讨论了检查“盖亚”自行运动以在各个尺度上寻找宇宙信号的一些数值方面的问题。
快速枚举有效混合运输以推荐托运人合作
本研究聚焦于一种联合运输形式——混合运输,并从数据库(物流大数据)中注册的众多运输线路中列举出具有高合作效果的组合。作为衡量混合运输效率的指标,我们考虑了总装载行程距离缩短的比例。所提出的算法能够即时展示所有减少率小于特定值的混合运输组合集。该算法比简单的暴力枚举方法快7000倍以上。
具有均匀瞬子的世界体积费米子在全息$\mathrm{QCD}_{3}$中的表现
我们利用D3/D7模型中均匀分布的D(-1)-膜,从拓扑学角度研究了味觉膜上世界体积费米子的有效理论。作为一种规范-引力对偶的自上而下的方法,D(-1)-膜是瞬子,并且在对偶理论中破坏了CP对称性。该模型的背景几何包括黑膜(去禁闭几何)和气泡D3膜解(禁闭几何),所有这些都具有非零的Romand-Romand零形式作为轴子。这些背景对应的对偶理论分别是有限温度下的超对称杨-米尔斯理论和三维限制杨-米尔斯理论,所有这些理论都由瞬子诱导出Chern-Simons项。在禁闭几何中,我们引入一个重子顶点作为一个包裹在$S^{5}$上的D5膜,然后将D7膜上的费米子流识别为重子算符。随后,我们研究了D7膜上味觉费米子的能谱和全息关联函数。值得注意的是,费米子的能谱与从禁闭关联函数获得的色散曲线一致,我们的模型中最低重子和介子的质量比接近相关的实验数据。此外,我们推导出了全息重子和介子的有效相互作用项,所有耦合常数的量级均为$N_{c}^{1/2}$,这与大N场论的评估结果一致。在去禁闭几何中,我们还数值计算了全息关联函数,而D7膜上的费米子被识别为等离子体费米子而非重子。从去禁闭关联函数得到的色散曲线基本上涵盖了硬热圈近似的结果,并可能暗示了带有自旋的瞬子诱导相互作用。总体而言,这项工作构建了一个关于具有瞬子或CP破缺的重子费米子和介子玻色子的全息理论。
具有模型不确定性的鲁棒反馈优化:正则化方法
反馈优化通过在闭环中实施优化迭代来优化动态系统的稳态,其依赖于在线测量和有限的模型信息,即输入-输出灵敏度。在实际应用中,由于不准确建模、观测不足或环境变化等问题,可能导致灵敏度失配,从而引起闭环次优甚至不稳定。为了解决这些问题,我们研究了鲁棒反馈优化,优化闭环性能以应对特定不确定性集合中的所有可能灵敏度。我们通过正则化提供了相应的min-max问题的可处理重构,并通过时变最优解情况下的跟踪误差表征了在线闭环性能。对配电网络的仿真结果证明了我们的鲁棒反馈优化控制器在非平稳环境下解决灵敏度失配问题的有效性。
基于电子雪崩的单光子全光调制
光的独特特性,如高速度、低损耗传播、低串扰和低功耗,以及光子独特的量子属性,使其成为通信、高分辨率成像、光学计算及新兴量子信息技术的理想选择。然而,传统介质弱光学非线性的限制因素给通过超低强度光控制光带来了挑战。在本工作中,我们展示了利用硅中的电子雪崩过程实现的基于控制光束(单光子强度)的全光调制。所观察到的过程对应的非线性折射率$n_{2}$达到$1.3*10^{-2} m^2/W$,比已知的最佳非线性光学材料高出几个数量级。我们的方法为吉赫兹甚至更快速度的单光子级光学开关提供了可能性,这可能实现一系列在室温下运行的新型芯片上光子和量子设备。
Trident:基于频域划分的多读写器无源反向散射网络干扰避免机制
反向散射技术是工业物联网应用中无电池传感的关键技术之一。为了全面覆盖部署区域内的大量标签,通常需要部署多个读写器,每个读写器与其通信范围内的标签进行通信。然而,实际情况下,标签反射的信号可能到达其通信范围之外的读写器并造成干扰。传统基于时分多址(TDMA)或载波侦听多路访问(CSMA)的干扰避免方法通过时间分离读写器的信道接入,导致网络吞吐量受限。本文提出了一种名为TRIDENT的新方案,通过频域划分实现干扰避免。该方案结合可调带通滤波器和多个终端负载,使反向散射标签能够检测信道状态并自适应调整反射信号的频率和功率。此外,我们还提出了针对读写器的频率分配算法。借助这些设计,网络中的所有读写器可以并发运行而不受干扰。我们实现了TRIDENT并在不同场景下对其性能进行了评估。结果表明,与基于TDMA的方案相比,TRIDENT提升了3.18倍的网络吞吐量。
图网络蒸馏中的后门攻击
图网络蒸馏作为一种提升图神经网络训练效率的技术,近年来备受关注。它通过将大规模图压缩为小型图,使得在小型合成图上训练的图神经网络(GNN)能够达到与在原始大规模图上训练相当的性能。然而,现有的图蒸馏研究主要集中在图大小与模型性能之间的最佳权衡(模型效用),却忽视了图蒸馏的安全性问题。为填补这一空白,我们首先探索了针对在压缩图上训练的图神经网络的后门攻击。我们提出了一种有效的图蒸馏后门攻击方法,称为BGC。该攻击旨在(1)即使注入触发器也能保持压缩图的质量,以及(2)确保触发器在整个蒸馏过程中保持有效性,从而实现较高的攻击成功率。具体而言,BGC在蒸馏过程中持续更新触发器,并针对代表性节点进行投毒。广泛的实验结果表明了我们的攻击的有效性:BGC在所有情况下均实现了接近1.0的高攻击成功率和良好的模型效用。此外,针对多种防御方法的结果表明,BGC在这些防御措施下仍然具有很强的鲁棒性。最后,我们分析了影响攻击效果的关键超参数。我们的代码已公开发布于:https://github.com/JiahaoWuGit/BGC。
一维范德瓦尔斯晶体中强混合声子
在一维(1D)系统中,显著的电子-电子相互作用和电子-声子相互作用现象普遍存在,这些现象可以通过Luttinger液体、Peierls不稳定性及其伴随的电荷密度波框架很好地描述。然而,1D中强混合声子的实验观测尚未实现。在此,我们通过结合光谱学和显微工具以及从头算密度泛函理论(DFT)计算,首次报道了一维凝聚态物质中强混合声子的一维观察结果,代表性的一维范德瓦尔斯晶体为双壁碳纳米管(DWNTs)。我们在一个简立方和三个非简立方DWNT晶体中观察到未被记录的声子模式,其中三种同时表现出强烈重构的电子能带结构。对于实验观测到的简立方DWNT(7,7)@(12,12),我们的DFT计算表明,这种新声子模式来源于构成内层和外层纳米管的两个横向声学模式(ZA模式)之间的(接近)简并耦合,这两个纳米管沿纳米管圆周具有近似三角形和五边形旋转对称性。这种耦合强烈混合了不同壳中的两个声子模式,并导致形成一种独特的晶格运动,其特征是在内外纳米管上的振动幅度均匀分布,这不同于一维系统中任何已知的声子模式。所有四种表现出显著新声子模式的DWNTs都显示出小的螺旋角扭曲、紧密匹配的直径比3/5、直径增大时新声子模式频率降低,所有这些均支持发现的耦合机制。我们发现DWNTs中的强混合声子为一维凝聚态物质中声子工程和探索新型声子相关现象开辟了新的机会。
ATLAS探测器在Pb+Pb碰撞中径向流集体性质证据的研究
各向异性流和径向流是研究夸克-胶子等离子体(QGP)膨胀动力学及其性质的关键探针。尽管各向异性流已得到广泛研究,但控制系统径向膨胀的径向流却较少受到关注。值得注意的是,尚缺乏径向流整体集体性质的实验证据。本文利用ATLAS探测器在$\sqrt{s_{\mathrm{NN}}}=5.02$ TeV能量下Pb+Pb碰撞中,通过两粒子关联方法首次测量了横动量($p_{\mathrm{T}}$)依赖的径向流涨落($v_0(p_{\mathrm{T}})$),覆盖$0.5<p_{\mathrm{T}}<10$ GeV范围。数据揭示了支持径向流集体性质的三个关键特征:伪快度上的长程相关性、横动量上的因子分解以及横动量上的中心无关形状。与流体力学模型的对比表明,$v_0(p_{\mathrm{T}})$对QGP的重要输运性质——体粘度具有敏感性。这些发现建立了一个新的、强大的工具,用于探索QGP的集体动力学及其性质。
组织、团队与工作流动:一种社会微观动力学方法
大型组织的内部结构在很大程度上决定了其内部发生的一切,包括任务的执行方式、执行任务的工人以及这些工人在组织内的流动性。然而,关于后者,目前用于理解组织内工人流动性的大多数理论和建模方法高度理想化,采用了诸如无结构组织、不可区分的工人以及工人缺乏社会纽带等理想化假设。本文借助一家大型美国政府机构十年来的精确、时间分辨率数据,提出了一种新模型,将组织描述为由团队组成的复合体,个人在其中执行特定任务,并且会发展出社会联系。通过追踪组织团队的人事组成变化,我们发现更换工作的工人受到倾向于与过去同事重聚的偏好影响较大。在该组织中,34%的所有调动导致了工人重聚,这一比例远高于预期。我们发现,工人共处的时间越长或共享的团队规模越小,他们重聚的可能性就越大,这支持了这种重聚背后熟悉度和信任感增加的观点,并强调了社会资本在大型组织演化中的主导作用。
共 13511 条搜索结果
共 13511 条