分类
施温格效应在超辐射轴子激光器中的作用
超辐射可以使围绕旋转黑洞的轴子云达到极高的密度,这些轴子的衰变可以产生强大的激光。这些激光的电场足够强,使得施温格效应可能变得显著,从而导致电子-正电子等离子体的产生。我们探讨了轴子激光器与这种电子-正电子等离子体之间的动力学关系。尽管有多种机制可以通过等离子体的影响改变激光的行为,但其中最重要的机制是电子-正电子等离子体赋予光子一个有效质量。随着等离子体频率的增加,轴子衰变变得不利,直到轴子不再衰变为光子,激光关闭。我们发现,电子-正电子等离子体对系统动力学的影响很大程度上取决于参数,特别是轴子的质量 \( m_\phi \) 和超辐射耦合 \(\alpha\),并且我们可以将参数空间划分为三个区域:未增强区、增强区和不稳定区。在未增强区和增强区内,系统最终会达到一个平衡状态,发出恒定亮度的激光,同时轴子数量保持不变。在未增强区,可以在忽略施温格效应产生的影响下计算出这个平衡状态;在增强区,平衡亮度略大于没有施温格效应时的亮度。在不稳定区,电子-正电子等离子体抑制了轴子的衰变,使得系统永远无法达到平衡;相反,轴子继续超辐射增长。在这三种情况下,超辐射轴子的产生最终会使黑洞减速到超辐射停止的程度。
Z-SASLM:零样本风格对齐的SLI潜空间操纵
我们提出了Z-SASLM(Zero-Shot Style-Aligned SLI Blending Latent Manipulation),这是一种零样本风格对齐的球面线性插值(SLI)潜空间混合操纵方法,克服了现有多种风格混合方法的局限性。传统方法依赖于线性混合,假定潜在空间为平坦空间,这在整合多参考风格时会导致次优结果。相比之下,我们的框架利用了潜在空间的非线性几何特性,通过SLI混合方法结合加权风格表示。通过沿超球面上的测地线进行插值,Z-SASLM保持了潜在空间的内在结构,确保了多样化风格的高保真度和一致融合——且无需微调。我们进一步提出了一种新的定量评估混合风格一致性的指标,即加权多风格DINO ViT-B/8。虽然我们的主要关注点在于SLI混合在风格操作中的理论和实践优势,但我们还通过全面的实验研究展示了其在多模态内容融合场景中的有效性。实验结果表明,Z-SASLM实现了增强且稳健的风格对齐效果。实现代码可访问:https://github.com/alessioborgi/Z-SASLM。
可达多面体推进(RPM):深度学习控制系统的精确分析工具
神经网络在机器人领域被越来越多地用作策略、状态转移模型或状态估计模型,甚至全部上述功能。由于这些组件是从数据中学习得到的,因此能够分析学到的行为及其对闭环性能的影响至关重要。本文朝着这一目标迈出了重要一步,开发了计算神经网络表示的动力系统控制不变集和吸引域(ROA)的方法。我们重点关注具有修正线性单元(ReLU)激活函数的前馈神经网络,因为它们已知实现连续分段仿射(PWA)函数。我们描述了可达多面体推进(RPM)算法,通过增量连接遍历枚举神经网络的仿射片段。然后,我们利用该算法计算精确的前向和后向可达集,并提供计算控制不变集和ROA的方法。我们的方法独特之处在于无需基于李雅普诺夫工具即可增量找到这些集合。在示例任务中,我们展示了通过学习的范德波尔振荡器和摆动模型,能够找到非凸控制不变集和ROA的能力。此外,我们还提供了加速计算ROA的算法,充分利用了RPM提供的增量和连接枚举仿射区域的优势。结果显示,在示例中加速比达到15倍。最后,我们将方法应用于求解飞机跑道控制问题中的图像驱动控制器稳定的状态集合。
$^{8}$Be的多通道微观团簇模型. I. 高能共振态的形成
详细研究了位于$p+^{7}$Li阈值附近及其上方的$^{8}$Be高能共振态的性质与结构。采用一种微观多团簇、多通道模型探讨这些共振态的形成过程。该模型包含三种不同的三团簇构型:$^{4}$He+$^{3}$H+$p$、$^{4}$He+$^{3}$He+$n$和$^{4}$He+$d$+$d$,从而能够全面处理$^{8}$Be的所有主要二体衰变通道,即$^{4}$He+$^{4}$He、$p+^{7}$Li、$n+^{7}$Be和$d+^{6}$Li。我们的分析重点在于双$1^{+}$、$2^{+}$、$3^{+}$和$4^{+}$共振态的结构及其主导衰变通道。此外,我们提出并实施了一种模型来阐明位于$p+^{7}$Li阈值下方的$2^{+}$共振态的形成机制。结果表明,这些共振态是由开放的$^{4}$He+$^{4}$He通道与闭合的$p+^{7}$Li、$n+^{7}$Be和$d+^{6}$Li通道之间的耦合作用产生的Feshbach型态。总体而言,当前方法对实验观测到的接近$^7$Li+$p$衰变阈值附近的共振谱(包括负宇称态$1^-$和$2^-$)提供了现实的描述。我们的结果与其他微观计算一致,但提供了更多关于这些共振态内部结构及衰变路径的详细见解。
长度受限的有向扩展分解与顶点容量图中的长度受限流捷径
我们证明了在有向图和无向顶点容量图中存在长度受限的扩展分解,而此前仅在无向边容量图中证明了其存在性[Haeupler-R\"acke-Ghaffari, STOC 2022;Haeupler-Hershkowitz-Tan, FOCS 2024]。在此过程中,我们还证明了有向图和无向顶点容量图中长度受限扩展的多商品最大流最小割定理。基于此分解,我们在无向顶点容量图中构建了长度受限的流捷径,大致而言,这是一种添加到图中的边和顶点集合,使得每个多商品流需求都能以大致相同的顶点拥塞度和长度进行路由,但所有流路径只包含少量边。这推广了[Haeupler-Hershkowitz-Li-Roeyskoe-Saranurak, STOC 2024]中针对无向边容量图的捷径。长度受限的扩展分解和流捷径在近期的无向边容量图算法中发挥了关键作用[Haeupler-Hershkowitz-Li-Roeyskoe-Saranurak, STOC 2024;Haeupler-Long-Saranurak, FOCS 2024]。因此,我们的工作为将这些概念推广到有向图和顶点容量图奠定了基础。
无监督学习:高维数据聚类技术的对比分析
本文对著名的聚类算法K-means、DBSCAN和谱聚类在高维数据集上的表现进行了全面的对比分析。我们提出了一种新的评估框架,通过多种定量指标(主成分分析PCA、t-SNE和UMAP降维技术)评估这些聚类算法的性能。实验基于MNIST、Fashion-MNIST和UCI HAR数据集的结果表明,使用UMAP进行预处理始终能提升所有算法的聚类质量,而谱聚类在复杂流形结构上的表现尤为突出。研究发现,算法的选择应依据数据特性,其中K-means在计算效率方面表现出色,DBSCAN适用于处理不规则簇,而谱聚类则更适合捕捉复杂关系。本研究为高维数据分析中的聚类技术评估与选择提供了系统性的方法。
实时环境下真实世界辅助生活中的动作识别
随着人口老龄化加剧以及老年人希望在家中独立生活的愿望,需要采取积极策略确保其安全与支持。环境辅助生活(Ambient Assisted Living, AAL)技术应运而生,通过在家庭环境中提供持续监控和协助,帮助老年人实现居家养老。在AAL技术中,动作识别在解释人类活动、检测跌倒、行动能力下降或异常行为等方面发挥着关键作用,这些行为可能预示健康状况恶化。然而,实际AAL应用中的动作识别面临诸多挑战,包括遮挡、噪声数据以及实时性能需求。尽管在准确率、抗噪性和计算效率方面取得了进展,但如何平衡这些因素仍是一个难题。为解决这一问题,本文介绍了一种鲁棒且高效的时序卷积网络(Robust and Efficient Temporal Convolution Network, RE-TCN),该模型包含三个主要组成部分:自适应时序加权(Adaptive Temporal Weighting, ATW)、深度可分离卷积(Depthwise Separable Convolutions, DSC)以及数据增强技术。这些组件旨在提升模型在真实AAL场景下的准确性、抗噪性和遮挡鲁棒性,同时提高计算效率。实验结果表明,RE-TCN在准确率、抗噪性和遮挡鲁棒性方面优于现有模型,并已在四个基准数据集(NTU RGB+D 60、Northwestern-UCLA、SHREC'17、DHG-14/28)上得到验证。代码已公开发布于:https://github.com/Gbouna/RE-TCN
RECALL-MM:用于风险分析的消费品召回多模态数据集:基于计算方法和大型语言模型的研究
产品召回为工程设计过程中的潜在风险和危害提供了宝贵的见解,但其全部潜力尚未得到充分利用。在本研究中,我们从美国消费品安全委员会(CPSC)的召回数据库中整理数据,开发了一个多模态数据集RECALL-MM,该数据集利用历史信息进行数据驱动的风险评估,并通过生成方法对其进行补充。数据集中揭示的模式突显了改进安全措施可能产生重大影响的具体领域。我们通过展示交互式聚类图进一步扩展了分析,这些图基于召回描述和产品名称将所有召回嵌入到共享的潜在空间中。利用这些数据驱动工具,我们探讨了三个案例研究,以展示该数据集在识别产品风险和指导更安全设计决策方面的实用性。前两个案例研究展示了设计师如何可视化被召回产品的模式,并将新产品想法置于更广泛的召回背景中,从而主动预测潜在危害。在第三个案例研究中,我们通过采用大型语言模型(LLM)仅基于产品图片预测潜在危害,这表明该模型能够利用视觉上下文识别风险因素,并在许多危害类别中与历史召回数据高度一致。然而,分析还指出了危害预测仍然具有挑战性的领域,强调了在整个设计过程中保持风险意识的重要性。总体而言,这项工作旨在弥合历史召回数据与未来产品安全之间的差距,提出了一种可扩展的数据驱动方法,以实现更安全的工程设计。
团队形成问题的QUBO框架
团队形成问题假设有一组专家和一项任务,每位专家具备一组技能,而任务需要某些特定技能。目标是在满足任务需求的同时,找到一组专家以最大化所需技能的覆盖范围,并同时最小化与专家相关的成本。不同的成本定义传统上导致了不同的问题公式化和算法解决方案。我们引入了统一的TeamFormation公式,该公式涵盖了团队形成问题的所有成本定义,平衡了任务覆盖率与专家成本。具体而言,我们通过二次无约束二进制优化(QUBO)方法提出了三种具有不同成本函数的TeamFormation变体,并评估了两种通用的求解方法。结果表明,基于QUBO公式的TeamFormation问题解决方案至少与现有的基准解决方案一样好。此外,我们还证明,利用图神经网络的基于QUBO的解决方案能够有效学习专家和技能的表征,从而实现迁移学习,允许从一个问题实例中获得的节点嵌入在另一个问题实例中高效应用。
借助实体邻域和关系上下文提升知识图谱补全
知识图谱补全(Knowledge Graph Completion, KGC)旨在推断知识图谱(Knowledge Graphs, KGs)中的缺失信息,以解决其固有的不完整性问题。传统基于结构的KGC方法虽然有效,但由于需要对知识图谱中的每个预测都进行密集嵌入学习和评分所有实体,因此面临显著的计算需求和可扩展性挑战。近期基于文本的方法通过利用像T5和BERT这样的语言模型将知识图谱三元组转换为文本进行推理,缓解了这些问题。然而,这些方法往往未能充分利用上下文信息,主要关注实体的邻域而忽略了关系的上下文。为了解决这一问题,我们提出了KGC-ERC框架,该框架整合了两种类型的上下文,以丰富生成式语言模型的输入并增强其推理能力。此外,我们引入了一种采样策略,在输入标记约束内有效地选择相关上下文,这优化了上下文信息的利用并可能提高模型性能。在Wikidata5M、Wiki27K和FB15K-237-N数据集上的实验表明,KGC-ERC在预测性能和可扩展性方面优于或匹配最先进的基线方法。
地球视觉统一Copernicus基础模型的研究
地球观测(EO)基础模型的进步解锁了大规模卫星数据从太空学习通用表征的潜力,从而造福于众多对地球至关重要的下游应用。然而,大多数现有工作仍局限于固定光谱传感器,仅关注地球表面,并忽略了图像之外的有价值元数据。在本文中,我们迈向下一代EO基础模型,提出了三个关键组成部分:1)Copernicus-Pretrain,一个大规模预训练数据集,整合了来自所有主要Copernicus哨兵任务的1870万对齐图像,覆盖了从地球表面到大气层的范围;2)Copernicus-FM,一种能够处理任何光谱或非光谱传感器模态的统一基础模型,采用扩展动态超网络和灵活的元数据编码方式;3)Copernicus-Bench,一个包含15个分层下游任务的系统评估基准,这些任务涵盖了从每颗哨兵任务的预处理到专门应用的各个阶段。我们的数据集、模型和基准极大地提升了EO基础模型的可扩展性、多功能性和多模态适应能力,同时为连接EO、天气和气候研究创造了新的机遇。代码、数据集和模型可在https://github.com/zhu-xlab/Copernicus-FM获取。
i-Mark博弈的一种收敛技术
i-Mark博弈是由索蓬加(Sopena)于2016年引入的一个公平组合博弈。该博弈由两个正整数集合S和D参数化,其中min D ≥ 2。从位置n ≥ 0出发,可以移动到任何位置n-s,其中s ∈ S且n-s ≥ 0,也可以移动到任何位置n/d,其中d ∈ D且n > 0且d整除n。当没有更多可移动的位置时,游戏结束,最后移动的玩家获胜。索蓬加以及随后的弗里曼和尼瓦施(Friman and Nivasch,2021)对许多i-Mark(S,D)情况下的Sprague-Grundy序列进行了表征,其中|D| = 1。弗里曼和尼瓦施还获得了某些部分结果,涉及i-Mark({1},{2,3})的情况。本文提出了一种收敛技术,为许多|D| > 1的i-Mark实例的Sprague-Grundy序列提供了多项式时间算法。特别地,我们证明了该技术适用于所有i-Mark({1},{d₁,d₂})博弈。关键词:组合博弈,公平博弈,Sprague-Grundy函数,收敛,动态规划。
等变Iwasawa理论对Ritter-Weiss模的应用研究
考虑一个有限的、交换的、CM型的扩展 $H/F$,其中 $F$ 是一个全实数域,我们构造了一个 $\mathbb{Z}_p[[G(H_\infty/F)]]-$ 模块 $\nabla_S^T(H_\infty)_p$,其中 $p>2$ 是一个素数,而 $H_\infty$ 是 $H$ 的循环 $\Bbb Z_p$-扩张。这是由Ritter和Weiss在文献\cite{Ritter-Weiss}中引入的一个模块的Iwasawa理论类比,并由Dasgupta和Kakde在文献\cite{Dasgupta-Kakde}中进一步研究。我们的主要结果表明,$\Bbb Z_p[[G(H_\infty/F]]^-$-模 $\nabla_S^T(H_\infty)_p$ 的投射维数为1,是二次可表的,并且其Fitting理想是主理想,由一个等变$p$-adic $L$-函数 $\Theta_S^T(H_\infty/F)$ 生成。作为一个初步应用,我们计算了算术上有意义的 $\Bbb Z_p[[G(H_\infty/F)]]^-$-模 $X_S^{T,-}$ 的Fitting理想,这是经典的不可分解Iwasawa模 $X$(即 $H_\infty$ 的最大阿贝尔、不可分解、pro-$p$ 扩张的Galois群)的一个变体,推广了Greither-Kataoka-Kurihara在文献\cite{Greither-Kataoka-Kurihara}中的早期结果。这些都是全实数域Iwasawa理论中的等变主猜想实例,并细化了Wiles在文献\cite{wiles}中证明的经典主猜想。作为一个最终应用,我们给出了Artin动机 $h_{H/F}$ 的等变Tamagawa数猜想的负$p$-部分的一个简洁的Iwasawa理论证明,适用于所有 $p>2$ 的素数,这一结果也独立地由Bullack-Burns-Daoud-Seo在文献\cite{Bullach-Burns-Daoud-Seo}和Dasgupta-Kakde-Silliman在文献\cite{Dasgupta-Kakde-Silliman-ETNC}中获得,但采用了不同的(欧拉系统)方法。
大半度定向图中具有两个块的路径的存在性
我们研究了在满足半度条件下的定向图中具有两个块的定向路径的存在性。对于正整数 $k$ 和 $\ell$,其中 $k/2 \leq \ell < k$,我们建立了保证包含大小为 $\ell$ 和 $k-\ell$ 的两个块的所有定向路径的半度函数。作为推论,我们证明了每个所有入度和出度至少为 $3k/4$ 的定向图都包含具有 $k$ 条弧的两个块的路径。我们的结果推广了关于Stein猜想及相关问题的先前工作。
利用漫反射探测功能性钙钛矿氧化物中的电子跃迁及缺陷诱导的Urbach尾带
本文利用漫反射光谱(DRS)对多种功能性钙钛矿氧化物(V₂O₅、BaSnO₃、PbZr₀.₅₂Ti₀.₄₈O₃、BiMnO₃和BiFeO₃)中的电子跃迁及由缺陷引起的Urbach尾带进行了详细研究。我们通过Kubelka-Munk(KM)函数、Tauc图以及反射的一阶导数对DRS光谱进行分析,以进行对比研究。BiMnO₃表现出具有间接带隙能量的电子跃迁,Eg=0.92 eV。相比之下,其他功能性钙钛矿氧化物(块状V₂O₅、BaSnO₃、PbZr₀.₅₂Ti₀.₄₈O₃和BiFeO₃)均显示出直接带隙的本征跃迁,其Eg值分别为2.27、3.25、3.10和2.48 eV。这些直接带隙功能性氧化物中与诱导缺陷相关的估算Urbach能量(EU)值分别约为0.24、0.38、0.25和0.48 eV。此外,由于(Ba, Ca)掺杂引起的化学压力以及粒径减小,多铁性BiFeO₃的带隙能量有所降低。重要的是,从反射一阶导数分析和Tauc图方法得出的功能性钙钛矿氧化物材料的带隙和Urbach能量值与利用Kubelka-Munk函数理论推导出的值高度一致。基于此,我们提出了多铁性BiFeO₃的一种全面的电子能带结构,该材料对于光伏、光催化和光电铁电等光电子应用具有重要意义。
密度泛函理论与半经典玻尔兹曼模拟研究填充型skutterudite $\textrm{CeIr}_\textrm{4} \textrm{P}_\textrm{12}$ 的热电性能用于能量转换
首次通过密度泛函理论和半经典玻尔兹曼输运模拟预测了填充型skutterudite $\textrm{CeIr}_\textrm{4} \textrm{P}_\textrm{12}$ 的结构、弹性、热力学及热电特性。首先,通过结构优化得到基态能量计算验证了其结构-磁性稳定性。预测的单晶弹性常数(${C}_{ij}$)表明该化合物在机械上是稳定的,并且由于所有计算出的声子频率均为正值,因此动态上也是稳定的。我们还计算了凝聚能以验证所研究材料的能量稳定性。此外,确定了一些宏观物理参数(如热膨胀系数和晶格热导率)随温度的变化关系。进一步研究了热电系数(如电子热导率和品质因子)随温度的变化规律。这些令人鼓舞的结果表明,该化合物是潜在的热电材料候选者。
结合全变差正则化的新型可学习纤维秩近似方法用于张量补全
近年来,张量纤维秩通过有效利用低秩张量补全(LRTC)中所有方向上的全局低秩特性,展示了令人印象深刻的表现。然而,它仍存在一些局限性。首先,基于张量核范数(TNN)的经典纤维秩近似采用固定且与数据无关的变换,可能并非最适合潜在的张量结构。其次,该方法忽略了数据集的局部分段平滑性。为了解决这些局限性,我们提出了一个非凸可学习纤维化核范数(NLTFNN)模型用于LRTC,该模型使用可学习的纤维化核范数与对数行列式(LTFNNLog)作为纤维秩近似,并采用全变差(TV)正则化来探索局部分段平滑性。基于乘子交替方向法(ADMM)开发了一种高效的算法来求解NLTFNN,并从理论上证明了算法的收敛性。在多种数据集上的实验结果表明,NLTFNN优于现有的一些方法。
重新审视端到端稀疏自编码器训练:只需短暂微调即可
稀疏自编码器(SAEs)广泛用于解释语言模型激活。一个关键评估指标是在用SAE重构的模型对数替换原始模型激活时,原始模型对数与重构模型对数之间的交叉熵损失增加量。通常,当用均方误差(MSE)重构预先计算并打乱的激活时,仅针对SAE进行训练。近期研究引入了直接结合Kullback-Leibler(KL)散度和MSE来训练SAE(“端到端”SAEs),显著提高了重构准确性,但付出了大幅增加计算成本的代价,这限制了其广泛应用。我们提出了一种简短的KL+MSE微调步骤,仅应用于最后2500万个训练标记(仅为典型训练预算的很小一部分),从而实现了可比的改进,将交叉熵损失差距减少了20%-50%,同时只带来极小的额外计算开销。我们进一步发现,多种微调方法(KL微调、LoRA适配器、线性适配器)在交叉熵改进方面表现出相似且非叠加的效果,表明MSE训练的SAE中存在一种共同的、容易修正的错误来源。尽管KL和MSE损失之间存在规模差异,我们展示了在不同训练阶段之间有效转移超参数和稀疏惩罚的一种简单方法。虽然ReLU和TopK SAEs都显示出显著的交叉熵损失改善,但在监督式SAEBench指标上的评估结果喜忧参半,具体取决于SAE架构和下游任务。然而,我们的方法可能在解释性应用(如电路分析)中提供有意义的改进,且附加成本较低。
自发口语台湾官话声调实现的研究:基于语料库的调查与基于理论的计算建模
越来越多的文献表明语义可以共同决定精细的语音细节。然而,语音实现与语义之间复杂的相互作用仍研究不足,尤其是在音高实现方面。本研究调查了台湾普通话自发语料库中双音节词的所有20种可能的声调组合的声调实现情况。我们利用广义可加混合模型(GAMs)将基频(f0)轮廓建模为一系列预测变量的函数,包括性别、声调环境、声调模式、语速、词位、双音节概率、说话者和词汇。在GAM分析中,词汇和词义成为基频轮廓的关键预测因素,其效应量超过了声调模式。对于数据集中的每个词例,我们通过将GPT-2大型语言模型应用于语料库中该词例的上下文,获得了上下文化的嵌入。我们证明,这些上下文化的嵌入可以在很大程度上预测词例的音高轮廓,这些嵌入近似于使用环境中特定词例的意义。我们的语料库研究表明,语境中的意义与语音实现之间的纠缠程度远超标准语言学理论的预测。
分数阶Hardy-Sobolev不等式的定量稳定性:Euler-Lagrange方程的作用
本文研究了分数阶Hardy-Sobolev不等式 $$ \mu_{s,t}\left(\mathbb{R}^N\right) \left(\int_{\mathbb{R}^N} \frac{|u|^{2^*_s(t)}}{|x|^t} \,{\rm d}x \right)^{\frac{2}{2^*_s(t)}} \leq \int_{\mathbb{R}^N} \left|(-\Delta)^{\frac{s}{2}} u \right|^2 \,{\rm d}x, \quad \text{对于所有 } u \in \dot{H}^s\left(\mathbb{R}^N\right), $$ 其中$N > 2s$,$s \in (0,1)$,$0 < t < 2s < N$,且$2^*_s(t) = \frac{2(N-t)}{N-2s}$。这里$\mu_{s,t}\left(\mathbb{R}^N\right)$表示该不等式中的最佳常数。文章重点探讨了上述不等式及其对应的Euler-Lagrange方程在正基态解附近的定量稳定性结果。此外,还建立了Euler-Lagrange方程的定性稳定性结果,并对相关能量泛函的Palais-Smale序列进行了全面刻画。这些结果推广了Bianchi和Egnell \cite{BE91}在经典Sobolev不等式方面的尖锐定量稳定性结果以及Ciraolo、Figalli和Maggi \cite{CFM18}在分数阶微积分框架下研究的经典临界指数问题的结果。
共 13511 条搜索结果
共 13511 条