分类
平均-方差团队随机博弈的策略优化与多智能体强化学习
本文研究了一种长期平均-方差团队随机博弈(MV-TSG),其中每个智能体共享一个共同的系统平均-方差目标,并独立采取行动以最大化该目标。MV-TSG面临两大挑战:首先,方差度量在动态环境中既非可加也非马尔可夫;其次,所有智能体同时更新策略会导致每个个体智能体处于非平稳环境。这两个挑战使得动态规划方法不可用。本文从基于灵敏度的优化视角研究了MV-TSG。我们推导了联合策略的性能差异公式和性能导数公式,为MV-TSG提供了优化信息。我们证明了该问题存在确定性纳什策略。随后,我们提出了一种平均-方差多智能体策略迭代(MV-MAPI)算法,采用顺序更新方案,按固定顺序逐个更新单个智能体策略。我们证明了MV-MAPI算法收敛到目标函数的一阶平稳点。通过分析平稳点的局部几何特性,我们得到了平稳点成为(局部)纳什均衡以及进一步成为严格局部最优解的具体条件。为了在未知环境参数的大规模MV-TSG场景中求解问题,我们将信任域方法的思想扩展到MV-MAPI,并开发了一种名为平均-方差多智能体信任域策略优化(MV-MATRPO)的多智能体强化学习算法。我们为联合策略的每次更新推导了性能下界。最后,我们在多个微电网系统的能量管理中进行了数值实验。
图神经网络中偏差缓解方法的比较研究
本文探讨了图神经网络(GNNs)在生成式人工智能(GenAI)系统数据准备中的重要作用,并特别关注解决和减轻偏差问题。我们对三种不同的偏差缓解方法进行了对比分析:数据稀疏化、特征修改以及合成数据增强。通过使用德国信贷数据集进行实验分析,我们采用多种公平性指标(如统计均等性、机会均等性和假阳性率)评估这些方法。研究表明,虽然所有方法相对于原始数据集都能改善公平性指标,但分层抽样和利用GraphSAGE进行的合成数据增强在保持模型性能的同时,在平衡人口统计学表征方面尤为有效。这些结果为开发更公平的AI系统提供了实用见解,同时确保了模型性能。
Rydberg原子链上的可积模型
我们系统地研究了具有受限希尔伯特空间的自旋链的可积模型;重点关注自旋-1/2链且带有Rydberg约束条件的情况。我们将之前关于中等范围自旋链的结果推广到受限希尔伯特空间,并提出了一个可积性条件。这使我们能够构建具有固定相互作用范围的新可积模型。我们分类了所有时间反演和空间反演对称的范围为3和4的Rydberg约束哈密顿量。在范围为3时,我们发现单一族的可积哈密顿量:即所谓的RSOS量子链,它们与著名的Andrews-Baxter-Forrester RSOS模型相关联。在范围为4时,我们发现了两族模型,其中第一族是受限XXZ模型。我们还发现了一族新的依赖于单一耦合常数$z$的模型。我们提供了两个与黄金比例$\phi$相关的临界点的证据,分别位于$z=\phi^{-1/2}$和$z=\phi^{3/2}$处。我们还对范围为5的可积哈密顿量进行了部分分类。
推进赫布卷积神经网络的生物合理性与有效性
本文研究了将赫布学习整合到卷积神经网络(CNNs)中用于图像处理的方法,系统地探索了不同的架构以构建最优配置,同时保持生物学上的合理性。赫布学习基于局部无监督的神经信息形成特征表示,为流行的但可能在生物学上不合理且计算密集的反向传播学习算法提供了一种替代方案。提出的最优架构显著提升了近期关于将赫布学习与竞争机制及CNN结合的研究成果,通过在一个单一模型中引入硬胜者通吃(WTA)竞争、高斯侧抑制机制以及Bienenstock-Cooper-Munro(BCM)学习规则,扩展了其表征能力。在CIFAR-10测试集后半部分的最后几个epoch中,所得最优模型的平均分类准确率达到了75.2%,这一结果与端到端反向传播变体相当,并且比相同网络深度的CNN中当前最先进的硬-WTA性能(64.6%)高出10.6%。此外,该模型在MNIST(98%)和STL-10(69.5%)数据集上也表现出竞争力。结果还显示,通过越来越复杂和抽象的感受野,实现了清晰的分层稀疏学习。总之,我们的实现不仅提高了学习表示的性能和泛化能力,而且构成了迈向更生物现实的人工神经网络的重要一步。
低退极化铜/钛和镍(钼)/钛中子超镜的退极化研究
中子超镜(SMs)是许多散射和粒子物理实验的重要组成部分。迄今为止,由于其饱和磁化强度低于镍/钛超镜,镍(钼)/钛超镜被用于需要传输极化中子束的实验中。然而,下一代β衰变实验要求超镜在每次反射中的退极化率低于10⁻⁴,以达到目标精度。目前,镍(钼)/钛超镜反射极化中子束的退极化程度尚未达到这一精度水平。最近开发的铜/钛超镜具有比镍(钼)/钛更低的饱和磁化强度,可能成为一种替代方案。本文测试了这两种镜片的性能。首先,我们在超级ADAM中子反射仪上测量了镍(钼)和铜单层的四态极化中子反射(PNR)曲线,并进行了完整的极化分析,结果显示两种材料的磁散射长度密度(mSLD)存在差异,铜的mSLD低于镍(钼)。这些结果通过Ni(钼)/Ti和Cu/Ti双层超镜的四态PNR曲线的完整极化分析得到了证实。其次,我们使用不透明测试平台装置测量了极化中子束在反射自相同镍(钼)/钛和铜/钛超镜后的退极化(D)程度。我们发现,在1σ置信水平下,Cu/Ti(4N5)的退极化率为D_Cu/Ti(4N5)<7.6×10⁻⁵,Ni(Mo)/Ti的退极化率为D_Ni(Mo)/Ti<8.5×10⁻⁵,Cu/Ti(2N6)的退极化率为D_Cu/Ti(2N6)<6.0×10⁻⁵,其中(4N5)对应于99.995%的钛纯度,(2N6)对应于99.6%的钛纯度。这些不确定度是统计性的。这些结果表明,这三种超镜均适合用于下一代β衰变实验。我们没有发现D值对q值或样品所处磁场有显著依赖性。
比较参数回归模型中评估治疗效果异质性的方法
本文回顾并比较了参数回归模型背景下评估治疗效果异质性的方法。这些方法包括标准的似然比检验、bootstrap似然比检验以及由随机效应方差为零的检验启发的Goeman全局检验。我们特别关注基于治疗效果得分残差的检验,并探讨此类检验的不同变体。所有方法均在模拟研究中进行比较,并通过一个多重剂量与安慰剂对比的研究展示了基于残差得分的方法。我们的研究结果表明,基于得分残差的方法为识别治疗效果异质性和治疗效果修饰因子提供了实用、灵活且可靠的有效工具,可为关于治疗效果异质性的决策提供有益指导。
双曲空间$H^{2n}$等距群余紧格点的曲面子群
我们证明了对于$n\geq2$的$\SO(2n,1)$中的任意余紧格点$\Gamma$,存在曲面子群。这一结果解决了汉姆施塔特(Hamenst\"adt)在2015年的工作中遗留下的秩一单李群非紧情形下未处理的情况。
星族考古驱动的星系演化(StAGE)
我们构建了一个以星族考古为基础的半经验星系演化框架(命名为StAGE)。星族考古提供了基于数据驱动的处方,从群体统计的角度出发,可以定义宁静星系(QGs)的前身天体的年龄和恒星形成历史。我们利用StAGE计算了本地QGs前身天体贡献的宇宙恒星形成率(SFR)密度,并表明其与高红移尘埃丰富的恒星形成星系的估计值高度一致,这表明这些星系群体之间存在直接的前身-后裔联系。此外,我们指出通过适当地校正观测到的恒星质量密度,将此类近红外暗弱的前身天体贡献考虑在内,StAGE恢复的SFR密度与来自紫外/红外/射电巡天的直接测定结果一致,从而在很大程度上缓解了一个长期存在的张力。相关地,我们也展示了StAGE如何提供QGs的平均质量和金属增丰历史及其随红移变化的统计特性。聚焦于大质量QGs中的超大质量黑洞(BHs),我们利用StAGE重建了平均BH质量增丰历史、随红移变化的宇宙BH吸积率密度以及残余恒星质量与BH质量之间的Magorrian型关系的演化。总之,StAGE可能构成一种有价值的工具,通过数据驱动、易于扩展且计算成本低的方法,理解宁静星系及其宿主超大质量黑洞在整个宇宙时间尺度上的共同演化。
蒸发驱动盐析的两相孔隙网络模型——孔尺度过程的表征与分析
蒸发驱动的盐析现象出现在不同场景中,并在土壤盐碱化或建筑材料中的应力引入沉淀等问题中带来挑战。在蒸发过程中,多孔介质中的卤水因水分流失而浓缩,直至达到溶解度极限,导致盐分沉淀。针对区域代表体积(REV)尺度已有一些有效行为描述的系统模型,但多项研究表明,蒸发驱动盐析的控制过程主要发生在孔隙尺度。因此,孔隙尺度模型对于深入理解这一过程至关重要。本文提出了一种动态、两相、非绝热的孔隙网络模型,用于描述蒸发驱动的盐析过程。盐析通过动力学反应建模,并考虑了由此引起的孔隙空间变化。此外,该模型还纳入了盐浓度对流体性质和液体角膜的影响。通过若干数值蒸发实验展示了模型的能力,模型能够表征由于沉淀导致的孔隙空间减少对流动、相位置换及盐传输的影响。同时,模型还描述了卤水-空气界面位置及其依赖于液体角流存在的特性。此外,可以模拟孔隙尺度的不均一性及其效应,如毛细泵送等。所有这些孔隙尺度效应都会影响盐析过程以及多孔系统的整体行为。本文提出的模型为研究孔隙尺度下的盐析过程以及向REV尺度的转换提供了通用工具。
多类型分支过程总后代分布的极限定理
多类型分支过程被定义为具有标记顶点的随机树,其中每个顶点根据相同的多变量概率分布独立产生后代。我们证明,在多类型分支过程的实际实现中,整棵树中不同类型的相对频率收敛到固定比例,而过程总规模的概率分布呈指数衰减。结果在假设所有后代分布的矩都存在的情况下成立。证明结合了树状拉格朗日反演公式、测度倾斜论证和局部极限定理。我们通过展示对随机图和多组分凝聚过程的应用来说明我们的集中结果。
硬 Exclusive 过程中异常维度基变换性质的研究
在描述硬 Exclusive 散射过程时,考虑复合算符的重整化问题,文献中常使用两种算符基:导数基和 Gegenbauer 基。本文建立了这两种基之间的显式相似变换,适用于夸克和胶子算符。通过利用这两种基的特性,可以计算描述非微扰非前进部分子分布尺度依赖性的算符异常维度。我们提供了该框架的多个应用实例。作为胶子变换公式的应用,我们计算了一阶圈非前进纯胶子异常维度矩阵。对于其余应用,我们专注于夸克算符的变换公式。在大夸克味数目 $n_f$ 极限下,我们以强耦合 $\alpha_s$ 的所有阶次扩展了之前在导数基中进行的 Gegenbauer 异常维度计算。接着,我们在导数基中展示了超出领头颜色限制的两阶异常维度的数值计算结果。最后,我们讨论了一种基于导数基领头颜色异常维度的新方法,用于验证现有的共形异常计算。
可学习的Cut流方法
神经网络已成为高能物理任务中的强大工具,然而其不透明的训练过程使其成为“黑箱”。相比之下,传统的Cut流方法简单且具有可解释性,但需要人工努力来确定最优边界。为融合两种方法的优势,我们提出了可学习的Cut流(Learnable Cut Flow, LCF),这是一种神经网络,将传统的Cut选择转化为完全可微、数据驱动的过程。LCF实现了两种Cut策略——并行策略,其中可观测量分布被独立处理;顺序策略,其中先前的Cut影响后续的Cut——以灵活地确定最优边界。在此基础上,我们引入了可学习的重要性,一种量化特征重要性的度量,并相应调整其对损失的贡献,提供了不同于随意指标的模型驱动洞察。为了确保可微性,修改后的损失函数用掩码操作替代硬Cut,从而在整个训练过程中保持数据形状。LCF在六个不同的模拟数据集和一个真实的双玻色子与QCD数据集上进行了测试。结果表明,LCF(1)在并行和顺序策略下准确地学习了典型特征分布的Cut边界,(2)为区分性强且重叠少的特征赋予更高的重要性,(3)稳健地处理冗余或相关的特征,(4)在真实场景中表现有效。在双玻色子数据集中,当使用所有可观测量时,LCF初始性能低于Boosted Decision Trees和Multi-Layer Perceptron。然而,通过根据学习到的重要性修剪不太重要的特征,其性能提升至与这些基准相当甚至超越。LCF弥合了传统Cut流方法与现代黑盒神经网络之间的差距,为训练过程和特征重要性提供了可操作的洞见。
信息增益并非你所需的一切
移动机器人自主探索由两个相互竞争的目标驱动:覆盖率,以彻底观察环境;路径长度,以尽可能最短的路径完成任务。尽管在不了解未知环境的情况下很难评估最佳行动方案,但未知环境往往可以通过模型、地图或常识来理解。然而,以往的研究表明,通过先验知识改善信息增益的估计会导致贪婪行为,并最终导致回溯,从而降低覆盖率性能。事实上,即使没有先验知识,任何最大化信息增益的方法都会表现出这种行为。任务完成后获得的信息增益是恒定的,无法进一步优化。因此,它不适合作为优化目标。相反,信息增益是一种决策标准,用于确定哪些候选状态仍应考虑进行探索。任务因此转变为以最短总路径完成任务。由于确定最短路径通常是不可行的,必须依赖启发式方法或估计来识别能最小化总路径长度的候选状态。为了解决这个问题,我们提出了一种启发式方法,通过优先选择靠近机器人但远离其他候选状态的状态来减少回溯。我们在仿真中评估了所提出的启发式方法的表现,与基于信息增益的方法和前沿探索进行了对比,结果显示我们的方法显著减少了总路径长度,无论是否有环境的先验知识。
使用合成爆发数据评估呼吸道疾病住院预测
传染病住院预测在流行病和大流行期间对医疗资源分配起着重要作用。大规模分析表明,在COVID-19疫情期间,模型预测的准确性分布具有异质性,集成预测的平均准确性最高。在此基础上,我们生成了包含324个不同住院时间序列的最大多样性合成数据集,对应不同的疾病特征和公共卫生响应。我们评估了14个分量模型和6种不同集成方法的预测结果。结果显示,分量模型的准确性具有异质性,并且取决于当前疾病的传播率。从7天到14天的预测中,机制模型相对于统计模型的相对准确性有所提高。一种新的自适应集成方法表现优于其他所有集成方法,但其后紧随的是中位数集成方法。我们还研究了集成误差与分量预测变异性的关系,发现变异系数可以预测未来的误差。最后,我们在瑞典的COVID-19疫情数据上验证了这些结果。我们的研究结果有望改进流行病预测,特别是在预测时根据分量预测的变异性为集成预测赋予置信度的能力。
DG-半素DG-代数、正合性与Hopkins-Levitzki定理在DG-代数中的类比
我们研究了Hopkins-Levitzki定理在微分分次(dg)代数$(A,d)$上的类比。首先我们考虑Hopkins的方法。在此方法下,我们证明对于具有分级Artinian循环代数$\ker(d)$的正合dg代数$(A,d)$,它也是左dg-Noetherian的,并且我们还证明了正合的dg-Artinian dg代数是dg-Noetherian的。接着,我们研究Levitzki的方法,引入了dg-半素代数的定义。对于dg-半素的dg-Artinian dg代数$(A,d)$,我们证明所有dg-单模都是正合的,并且所有具有有限dg-合成长度的dg-模也是正合的。最后,我们证明具有幂零dg-根基$dgrad_2(A,d)$的dg-Artinian dg-半素dg代数是dg-Noetherian且正合的。
通过传递闭包达到经典性
近期,arXiv:2312.16035的研究表明,所有基于布尔正单调三值方案的逻辑在使用严格-容许标准($\mathbf{st}$)定义时均等价于经典逻辑。相反,他们证明了在容许-严格标准($\mathbf{ts}$)下,所得到的逻辑均为空。在此基础上,我们展示了通过在两个分别基于(可能不同的)布尔正单调方案定义的逻辑的并集上施加传递性的严格-严格标准($\mathbf{ss}$)和容许-容许标准($\mathbf{tt}$),可以得出经典逻辑,其中一个逻辑为超完备逻辑,另一个为超一致性逻辑。随后,我们确定了一个与传递性对偶的概念,用于刻画逻辑$\mathsf{TS}$为任意两个分别基于(可能不同的)布尔正单调方案定义的逻辑的交集的对偶传递闭包,其中一种逻辑采用$\mathbf{ss}$标准,另一种采用$\mathbf{tt}$标准。最后,我们进一步探讨了传递闭包与对偶传递闭包操作之间的抽象关系,表明它们产生了精确捕捉所讨论逻辑之间关系的格运算。
Beta 多胞体与 Beta 锥:几何概率中的一个完全可解模型
设 $X_1,\ldots, X_n$ 是单位球内的独立随机点,且 $X_i$ 遵循密度为 $(1-\|x\|^2)^{\beta_i}1_{\{\|x\| <1\}}$ 的 beta 分布。这里,$\beta_1,\ldots, \beta_n > -1$ 为参数。我们研究形如 $[X_1,\ldots,X_n]$ 的随机多胞体,称为 beta 多胞体。我们明确计算了这些多胞体的多个泛函的期望值,包括 $k$-维面的数量、体积、内蕴体积、$k$-骨架的总 $k$-体积、各种角度和、以及推广并统一上述例子的 $S$-泛函。我们确定并研究分析 beta 多胞体所需的核心对象:beta 锥。对于这些锥体,我们明确计算了多个泛函的期望值,包括固角、锥体内蕴体积和 $k$-维面的数量。我们将 beta 锥的期望锥体内蕴体积识别为表达上述所有泛函的关键量。我们通过函数 $\Theta$ 提供了一个表达这些期望锥体内蕴体积的公式,并给出了 $\Theta$ 的显式积分表示。证明结合了积分几何与随机几何的方法,以及对函数 $\Theta$ 的解析性质的研究。
基于CLIP的自适应加权参数融合在类别增量学习中的应用
类别增量学习(CIL)使模型能够逐步吸收来自新类别的知识,并构建一个涵盖之前所有遇到类别的通用分类器。当模型优化新类别时,不可避免地会遗忘旧类别知识,导致灾难性遗忘。解决这一挑战需要在保留旧知识和容纳新信息之间做出权衡。然而,这种平衡过程往往需要牺牲部分信息,从而导致模型区分不同类别的能力部分丧失。为了解决这个问题,我们设计了基于对比语言图像预训练(CLIP)的自适应加权参数融合方法,该方法不仅考虑了不同任务数据分布的变化,还最大程度地保留了参数矩阵的所有有效信息。此外,我们引入了一个平衡因子,可以平衡相邻任务的数据分布对齐和可区分性。在多个传统基准数据集上的实验结果验证了所提出方法的优越性。
具有多个折扣因子的折扣和自动机
对未来事件影响进行折现是经济学中的一个关键范式,并广泛应用于计算机科学模型中,例如博弈、马尔可夫决策过程(MDPs)、强化学习和自动机。虽然单个博弈或MDP可能允许存在多个不同的折扣因子,但非确定性折扣和自动机(NDAs)的研究仅限于单一折扣因子。已知每个具有整数折扣因子的NDAs类都具有良好的计算特性:在确定化和代数运算(min、max、加法和减法)下封闭,并且其基本决策问题(如自动机等价性和包含性)存在算法。将整数折扣因子扩展到任意有理数时,大部分这些良好特性会丢失。我们定义并分析了每条转移可以具有不同整数折扣因子的非确定性折扣和自动机(积分NMDAs)。我们证明,对于任意选择的折扣因子,积分NMDAs在确定化和代数运算下不封闭,其包含问题是不可判定的。然后,我们定义并分析了一类受限的积分NMDAs,称为整洁的NMDAs,其中折扣因子的选择取决于所读单词的前缀。它们的特殊情况包括将折扣因子与动作(字母)或经过的时间相关联的NMDAs。我们证明,对于定义折扣因子选择的任何函数$\theta$,$\theta$-NMDAs类在所有上述NDAs的良好特性方面均表现出色,并且所需决策问题的复杂性相同。整洁的NMDAs在表达能力上也等价于具有任意折扣因子选择的确定性积分NMDAs。
π介子散射振幅的隐藏零点与精确因子化的图解推导
近期发现π介子散射振幅在特定运动学位置处消失,并且在其附近可以因子化为扩展理论中两个较低点振幅的乘积。我们提出了一种π介子振幅的图解表示方法,使得其在这些位置上的消失得以直观地展现于每一幅图中。此外,我们提供了证据表明存在一个闭合形式的表达式,该表达式以精确的方式推广了接近这些位置时的因子化行为,不仅限于这些位置附近,而是适用于所有运动学构型。我们的方法关键依赖于π介子有效场论的一种新表述方式,即通过一组协变守恒流和新兴复合规范场的经典场方程提取树级散射振幅。
共 13511 条搜索结果
共 13511 条