分类
主动电网韧性管理的全局决策聚焦神经常微分方程
极端灾害事件(如野火和飓风)对电力系统构成日益严重的威胁,导致大范围停电并中断关键服务。近年来,在电网运行中预测-然后优化的方法逐渐流行,即首先生成系统功能预测,然后将其用作下游决策的输入。然而,这种两阶段方法往往会导致预测和优化目标之间的不一致,从而导致资源分配次优。为了解决这一问题,我们提出了预测-全部-然后全局优化(PATOG)框架,该框架将断电预测与全局优化干预措施相结合。在其核心部分,我们的全局决策聚焦(GDF)神经常微分方程模型在决策感知的方式下捕捉断电动态并优化韧性策略。与传统方法不同,我们的方法确保空间和时间上的一致决策制定,从而提高预测准确性和运营效率。在合成数据集和真实数据集上的实验表明,断电预测一致性以及电网韧性均得到了显著提升。
Matrix3D:面向大型摄影测量模型的一站式解决方案
我们介绍了Matrix3D,这是一个统一的模型,仅使用相同的模型即可执行多种摄影测量子任务,包括姿态估计、深度预测和新颖视图合成。Matrix3D利用多模态扩散变压器(DiT)在图像、相机参数和深度图等多种模态之间集成转换。Matrix3D实现大规模多模态训练的关键在于引入了掩码学习策略,这使得即使在部分完整数据(如图像-姿态和图像-深度对的双模态数据)的情况下也能进行全模态模型训练,从而显著增加了可用的训练数据池。Matrix3D在姿态估计和新颖视图合成任务中展示了最先进的性能。此外,它通过多轮交互提供细粒度控制,成为三维内容创建的一项创新工具。项目页面:https://nju-3dv.github.io/projects/matrix3d。
关于纤维型曲线的拓扑:仿射结点曲线的一对Zariski
本文探讨了光滑射影曲面上的曲线其补集的基本群为循环群自由积的条件。已知如果曲面是$\mathbb{P}^2$,那么这样的曲线必须是纤维型的,即一个可容映射到复曲线上的有限纤维并集。在此设定下,我们展示了一组无限多的纤维型曲线的Zariski对,即具有同胚管状邻域但嵌入$\mathbb{P}^2$方式不同的平面射影纤维型曲线对。这包括了一对在$\mathbb{C}^2$中的曲线,它们仅具有节点奇点(且在无穷远处有相同的奇点),而它们的补集具有非同构的基本群,其中一个群是自由群。我们的例子表明,节点的位置也会影响射影曲线嵌入的拓扑结构。对于此目的,有限$SU(2)$表示下的扭Alexander多项式显示是有用的,因为两者的基本群的所有交换不变量都相同。
光学虫洞中光轨迹与波动力学
我们研究了一种由恒定负高斯曲率表征的虫洞几何结构的光学特性。这种独特的光学结构通过静态BTZ黑洞的光学度规进行建模,对应于双曲虫洞框架。在该模型中,我们推导了任意测地线及其相关的有效势能。我们的分析表明,随着光学虫洞曲率半径的减小,有效势能变得越来越窄,并且所有可能的轨迹都汇聚到光学原点\(\rho=0\)。我们进一步分析了控制在这种弯曲表面上光传播的波模式,证明了在小\(\rho\)和大\(\rho\)极限下,有效势能均表现为纯粹排斥力。尽管势能在两种情况下均为有限值,但其行为存在显著差异。在光学原点附近,磁量子数(\(m\))对有效排斥势有显著影响,尤其是在\(m\)较大时,势能类似于典型的势垒。然而,这种效应会随着光学距离的增加而减弱。利用这一框架,我们计算了\(m \neq 0\)时的反射系数和透射系数。我们的研究结果表明,背景的光学性质主要受光学虫洞曲率半径的影响,突显了它在塑造此类几何结构中光传播的关键作用。
利用LHC超相对论铅-铅碰撞提取夸克-胶子等离子体中的声速
超相对论核碰撞会形成一种具有显著集体流行为且粘性耗散极小的热密夸克-胶子物质态。为了深入了解其内在性质和基本自由度,我们利用中心-of-质量能量为每对核子5.02 TeV的铅-铅(PbPb)碰撞,在夸克-胶子等离子体的扩展体积内确定了声速。数据由CERN LHC上的CMS实验记录,对应积分为0.607 nb$^{-1}$的亮度。该测量通过研究头碰头PbPb碰撞中发射的带电粒子平均横动量的多重依赖性来进行。我们的结果表明,这种物质中的声速接近光速的一半,自然单位下的平方值为0.241 $\pm$ 0.002(统计)$\pm$ 0.016(系统)。利用平均横动量估算的有效介质温度为219 $\pm$ 8(系统)MeV。在此温度下测得的声速平方值与格点量子色动力学(QCD)计算的预测精确一致。这一结果对所创介质的状态方程提供了严格的限制,并直接证明了在相对论核碰撞中达到了去禁闭的QCD相。
结构不足以解决问题:利用行为特征进行神经网络权重重建
近年来,神经网络(NNs)的权重在机器学习领域成为一种新的数据模态,其应用范围涵盖了准确率预测、超参数预测、表征学习以及权重生成等多个方面。一种利用神经网络权重的方法是训练自动编码器(AEs),通过对比损失和重建损失来实现。这种方法使这些模型能够广泛应用于各种下游任务,并表现出较强的预测性能和较低的重建误差。然而,尽管重建误差较低,这些自动编码器重建出的神经网络模型性能却较原始模型有所下降,限制了其在模型权重生成方面的实用性。本文指出权重空间自动编码器的一个局限性,即结构损失(使用原始权重与重建权重之间的欧几里得距离)未能捕捉到一些对重建高性能模型至关重要的特征。我们分析了在权重空间中训练自动编码器时加入行为损失的效果,其中通过比较给定常见输入下重构模型与原始模型的输出,验证了结构信号与行为信号之间存在强大的协同效应,从而显著提升了所有评估的下游任务(特别是神经网络权重的重建与生成)的性能。
麦哲伦云中心跳星的潮汐振幅
心跳(HB)星由于近日点处由强潮汐引起的椭球形畸变,在每个轨道周期内会在光变曲线上表现出脉冲。我们分析了通过OGLE巡天观测到的麦哲伦云中的HB星群体,并通过宽带谱能量分布拟合来估算这些HB星的物理特性。这些HB星在亮度、半径和有效温度方面覆盖了一个广泛的范围,但发现它们集中在近日点附近受到强烈潮汐影响的位置,表明在几乎所有情况下,强烈的潮汐确实是它们光变的主要原因。HB星倾向于分布在远离主序星的区域,那里恒星演化特别迅速。我们研究了潮汐振幅的分布,并展示了这些可以通过恒星演化过程中半径增长以及通过线性潮汐耗散导致轨道圆化的简化模型来解释。当我们比较潮汐耗散率时,发现热星($T_{\rm eff}>6250$~K,$Q_\ast' \gtrsim 10^7$)和冷星($T_{\rm eff}<6250$~K,$Q_\ast'\sim 10^5$)之间存在差异,这在定性上与冷星对流包层中高效潮汐耗散的模型一致。我们发现该模型可以重现HB星在赫罗图上的观测位置和振幅。特别是热星的振幅接近但未超过非线性潮汐波破碎在恒星表面的阈值,表明潮汐振幅在此阈值处存在物理饱和现象。
非相对论11维超引力的惊人结构
我们研究了11维超引力的一个非相对论极限。这一极限导致一个具有膜Newton-Cartan几何基础的理论。非相对论极限的一致性要求施加约束条件,要求某些玻色和费米子的挠率和曲率消失。我们探讨了两种版本这些约束条件的含义。在一种版本中,我们仅保留16个超对称变换,这导致了一个简单的(纯玻色)约束结构,但超对称代数的实现异常,且不闭合为微分同胚。在另一种情况下,我们保留全部32个超对称变换。这需要一连串复杂的玻色和费米子约束,最终涉及玻色场的三阶导数。我们通过线性化计算论证,这一约束序列终止。此外,我们证明存在一组满足这些约束条件的超对称解,其中包含了Lambert和Smith最近获得的M2超引力解的非相对论极限,该解作为非相对论全息背景是相关的。
被照射后就打盹了?一个快速淬灭的剩余泄漏候选体在z=8.5处具有陡峭的光谱$β_{UV}$斜率
我们利用NIRSpec MSA光谱和NIRCam测光法研究了JADES-GS8-RL-1的性质,这是一个在z=8.5时快速淬灭的星系,其恒星质量为$10^{8.9}M_\odot$,具有陡峭的紫外蓝斜坡、Balmer断层,并且没有强烈的发射线迹象。从NIRSpec光谱测量得到的$\beta_{UV}$=-2.8$\pm$0.2表明,该星系几乎不存在尘埃消光,并且星云连续辐射的贡献可以忽略不计,同时可能具有较高的逃逸分数。从测光数据中测量的$\beta_{UV}$斜率从中心区域的-3.0变化到外围的-2.2,这表明逃逸分数可能存在区域性差异。没有检测到高电离发射线,仅在[OII]中观察到2.9σ的微弱信号。使用测光数据,这种发射似乎扩展开来,可能对应于在或之后因淬灭过程而排出的弱电离气体。JADES-GS8-RL-1的空间分辨率为半亮度半径240 pc,具有指数型、盘状形态。它似乎在过去1亿年内经历了短暂的恒星爆发,形成时间约为70百万年,淬灭时间为约30百万年。这种淬灭发生得非常迅速,使其成为高红移下低质量“小型淬灭”星系的一个更遥远的例子。由于其极蓝的$\beta_{UV}$斜率,我们拟合的最佳模型预测了超过10%的逃逸分数$f_{esc}$,这一结果与从$\beta_{UV}$斜率推导出的值一致,并结合我们异常低的O32上限,表明JADES-GS8-RL-1是在再电离时期早期阶段的一个有趣高红移“剩余泄漏”星系实例。
大型语言模型在多样化创意写作中的后训练方法研究
创意写作任务不存在单一正确答案,因此针对此类任务训练的大规模语言模型(LLMs)应能够生成多样且有效的输出。然而,目前的大模型后训练往往侧重于提升生成质量,却忽视了促进输出多样性的重要性。因此,在创意写作生成领域,我们研究了后训练方法以同时提高输出多样性和质量。我们的核心思路是在训练目标中引入偏差——即同一个提示下,训练样本与其他所有样本之间的差异程度——以促进从稀有高质量样本中学习。通过采用我们的方法对直接偏好优化(DPO)和优势比偏好优化(ORPO)进行改进,我们证明可以提升模型的输出多样性,同时仅轻微降低质量。我们的最佳模型(参数量为80亿)在输出多样性方面达到了与人类创作数据集相当的水平,而输出质量则接近我们考察的最佳指令微调模型(GPT-4o和DeepSeek-R1)。此外,我们通过人工评估、消融实验以及与现有多样化方法DivPO的比较进一步验证了我们的方法。
模拟尖峰神经网络CoLaNET的数字机器学习算法
在过去的几年里,我们的研究团队致力于开发一种尖峰神经网络(Spiking Neural Network, SNN)架构,该架构可用于广泛的有监督学习分类任务。其运行条件是所有参与信号(被分类对象描述、正确类别标签和SNN决策)都具有尖峰特性。最终,我们发明了CoLaNET(列状分层网络)SNN架构。该架构的独特之处在于结合了对应于不同类别的原型网络结构以及显著区分同一类别实例的结构(=列)和列内功能不同的神经元群体(=层)。另一个独特特征是一种新颖的反-Hebbian可塑性和多巴胺调控可塑性的组合。尽管CoLaNET相对简单,但它包含多个超参数,针对具体分类任务选择这些超参数并非易事。此外,被分类数据的具体特征(例如MNIST数据集中的单独图片分类与连续视频流中物体分类)需要对CoLaNET结构进行特定修改。为了解决这些问题,必须对CoLaNET进行深入的数学探索。然而,由于SNN是随机离散系统,通常很难进行精确的数学分析。为此,我开发了一种连续数值(非尖峰)机器学习算法,可以以令人满意的精度近似CoLaNET的行为。本文对此进行了描述。目前,该算法正通过精确的解析方法进行研究。我们希望这项研究的结果能够应用于直接计算CoLaNET的超参数并优化其结构。
超越准确率:设计表现良好模型的关键因素是什么?
深度学习已成为计算机视觉的重要组成部分,深度神经网络(DNNs)在预测性能方面表现出色。然而,它们在其他关键质量维度(如鲁棒性、校准或公平性)上往往表现不足。尽管现有研究已经关注了这些质量维度的一部分,但尚未探索DNNs更广泛的“表现良好”形式。通过本研究,我们通过同时研究图像分类的九个不同质量维度填补了这一空白。通过大规模研究,我们通过对326个主干模型进行分析,揭示了不同的训练范式和模型架构如何影响这些质量维度。我们发现了多种新的见解,例如:(i) 视觉-语言模型在ImageNet-1k分类任务中表现出较高的公平性,并对域变化具有较强的鲁棒性;(ii) 自监督学习是一种有效的训练范式,可以提升几乎所有考虑的质量维度;(iii) 训练数据集的规模是大多数质量维度的主要驱动因素。我们的研究最后引入了QUBA评分(超越准确率的质量理解),这是一种新颖的指标,能够从多个质量维度对模型进行排名,从而基于特定用户需求提供定制化建议。
中央调控下非合作博弈的社会优化问题
本文基于中央调控下的非合作博弈提出了一种新的优化问题,其可以被构造成双层结构。在下层,每个参与者竞相最小化自己的成本函数,该函数不仅依赖于所有参与者的策略,还取决于中央调控者的干预决策;而位于上层的中央调控者试图通过可调的干预决策实现社会最优,即最小化所有参与者的成本函数之和。在此设定下,受中央调控者干预时,下层参与者进行非合作博弈并寻求纳什均衡,而这实际上与调控者的决策相关。同时,调控者的目的是选择一个决策使得社会成本(即所有参与者的成本函数之和)最小。该构建的双层社会优化问题是受约束、非凸且非光滑的。为解决这一复杂问题,利用平滑技术开发了一种不精确的零阶算法,允许以不精确的方式计算下层博弈的纳什均衡。借助平滑技术的特性,严格证明了所设计的算法对于具有平滑目标的相关优化问题达到次线性收敛速率。此外,还讨论了在下层博弈存在精确均衡的情况下次线性收敛速率的问题。最后,通过数值模拟验证了理论结果的有效性。
处理多项式回归的双正交多项式的递归构造
提出了一种自适应方法来构建在相同有限维内积空间中与单项式基底双正交的多项式。通过利用现有的正交多项式,所提出的方法减少了经典多项式回归中矩阵求逆引起的众所周知的不稳定性问题。双正交基底的递归生成使得可以方便地升级其所有成员以包含新增的一个,并且允许自然降级基底。这一便利特性为减少多项式回归近似中的项数提供了一个直接的方法。这种方法的优点通过一系列例子得到展示,其中所得的双正交基底由Legendre、Laguerre和Chebyshev正交多项式导出。
基于后训练语言模型引导多级特征注意力网络的恶意URL检测方法(PMANet)
恶意URL的泛滥使其检测成为提升网络安全的关键任务。尽管预训练语言模型带来了希望,但现有方法在领域特定适应性、字符级信息处理以及局部-全局编码集成方面存在不足。为解决这些挑战,我们提出了PMANet(后训练语言模型引导的多级特征注意力网络)。PMANet通过三种自监督目标(掩码语言建模、噪声语言建模和领域区分)进行后训练过程,有效捕获子词和字符级信息。它还包括一个分层表征模块和动态逐层注意力机制,用于从低到高提取特征。此外,空间金字塔池化实现了局部和全局特征的整合。实验结果表明,PMANet在小样本数据、类别不平衡和对抗攻击等多种场景下优于最先进的模型,案例研究中正确检测出全部20个恶意URL,AUC值达到0.9941。代码和数据集可在https://github.com/Alixyvtte/Malicious-URL-Detection-PMANet获取。
涨潮是否能抬高所有船只?基于AI的心脏磁共振分割中的偏置缓解研究
人工智能(AI)在医学影像任务中的应用日益广泛,然而,这些模型可能存在偏置,特别是在训练数据集不平衡的情况下。例如,在心脏磁共振(CMR)图像分割模型中存在明显的种族偏置效应。尽管这一现象已在多篇文献中报道,但对该领域偏置缓解算法的有效性知之甚少。我们旨在研究常见的偏置缓解方法对基于AI的CMR分割模型中黑人与白人受试者之间偏置的影响。具体而言,我们采用过采样、重要性重加权以及分组分布鲁棒优化(Group DRO),并结合这些技术来减轻种族偏置。此外,受到关于AI驱动的CMR分割偏置根本原因的最新研究启发,我们还评估了在裁剪后的CMR图像上训练和评估的模型中相同的方法。结果表明,过采样能够有效减轻偏置,显著提高代表性不足的黑人群体的表现,同时不会显著降低多数白人群体的表现。分组分布鲁棒优化也能提升黑人群体的表现,但效果不显著,而重要性重加权则降低了黑人群体的表现。结合过采样和分组分布鲁棒优化同样能改善黑人群体的表现,但效果不显著。使用裁剪后的图像可以提高两个种族群体的表现,并减少偏置,而结合过采样技术进一步减少了偏置。
旋转白矮星坍缩及多信使信号
我们展示了三维数值相对论模拟旋转磁化白矮星(WDs)核心坍缩的结果,旨在讨论爆炸动力学及相关多信使信号:引力波(GWs)、中微子和电磁对应体。所有白矮星均因电子俘获而引发引力坍缩,并在原中子星形成后经历快速爆炸。我们观察到在快速旋转模型中,爆炸主要由双极结构主导,并伴随强螺旋波的出现。螺旋波有助于增加爆炸能量和喷出物质量,但最终值仍属于低能爆炸且喷出物质量较小的超新星类别。螺旋波还会产生强烈的引力波,这可能将此类事件的引力波探测范围扩展至第三代地面探测器的约10 Mpc。此外,作为一个有趣的推论,我们证明了此类由吸积或并合引起的白矮星坍缩可能能够解释一些快速演化的光学暂现源,例如快速蓝光暂现(FBOT),如先前所建议的那样。基于模拟结果以及若干假设,我们确认磁星可以解释观测到的FBOT更亮的一侧,而在没有磁星形成的情况下,喷出物-包层相互作用以及随之爆炸合成的重元素放射性衰变也可能解释较暗的一侧。
LHC隧道的可能未来应用
CERN的FCC计划为解决粒子物理学中的许多关键问题提供了一个有吸引力的一体化解决方案。尽管我们完全支持这一雄心勃勃的计划,但我们认为,有必要制定一种缓解策略,以防该计划因地缘政治或其他原因面临意外障碍。这种策略可以基于两个组成部分:I)在LHC隧道内运行于Z玻色子能量(45.6 GeV)的环形电子-正电子对撞机;II)高能电子-正电子直线对撞机,作为希格斯玻色子、顶夸克和W玻色子工厂,并可进一步扩展至TeV能区。前者能够达到直线对撞机无法企及的高亮度,后者则比LEP3具有更高的灵敏度和发现潜力,可用于探测高能区域。该计划应辅以低能强度前沿搜索。这些加速器可以以可行、及时且成本效益高的方式用于寻找新物理并精确确定标准模型参数。
星座控制与数据采集框架的网络发现协议开发
在测试束流环境中对新探测器进行认证是一项具有挑战性的任务,它需要多种设备稳定运行,而这些设备常常使用多个数据采集系统。由于设施的不同,这类设置经常发生变化,例如使用不同的参考探测器。管理这种复杂性需要一个能够控制数据采集、监控实验装置、实现无缝配置并便于新设备集成的系统。此类系统的方面之一就是网络配置。许多系统要求参与数据采集的所有机器都具有固定的IP地址,这为用户增加了复杂性。本文描述了一种针对网络分布式控制和数据采集系统定制的网络发现协议。
高斯过程何时具有其路径位于再生核希尔伯特空间中的性质?
我们研究了对于哪些高斯过程存在或不存在包含其几乎全部路径的再生核希尔伯特空间(RKHS)。特别是,我们得到了一个新的结果,使得在许多情况下可以排除此类RKHS的存在。此外,我们将这一否定结果与一些已知技术相结合,得到了肯定的结果。结果表明,对于许多经典的高斯过程族,我们可以完全刻画出这些族中哪些成员的路径可被包含于RKHS中。类似地,对于协方差函数的RKHS为Sobolev空间或混合光滑度Sobolev空间的高斯过程,我们也得到了相应的刻画。
共 13511 条搜索结果
共 13511 条