分类
大型强子对撞机中自旋-1共振的唯象学
自旋-1共振是由复合希格斯模型预测的状态之一,其质量预计在几个TeV范围内。本文集中讨论基于规范-费米子描述的模型,这些模型预测了具有QCD色荷的矢量和赝标矢量态,以及带有电弱规范群电荷的状态。根据模型细节的不同,前者可以表现为三重态、六重态或八重态。所考虑的所有模型都具有一种共同的颜色八重态矢量态,由于其与胶子混合,可以在强子对撞机上单独产生。本文总结了这些共振在大型强子对撞机上的唯象学,并对与未来对撞机相关的问题进行了评论。
随机纠缠电流的$\varphi^4$模型:平移不变Gibbs测度及相变连续性
我们证明了在多项式增长图上的$\varphi^4$模型中,对于所有$\beta$值,自同构不变的Gibbs测度最多有两个极值测度。我们还给出了一个确保所有Gibbs测度为单元素集合的充分条件。作为应用,我们展示了三维及以上维度的最近邻$\varphi^4$模型在临界点处的自发磁化强度为零。类似的结果在Aizenman、Duminil-Copin和Sidoravicius(《Comm. Math. Phys.》,2015)以及Raoufi(《Ann. Prob.》,2020)关于Ising模型的经典工作中通过Aizenman(《Comm. Math. Phys.》,1982)引入的随机电流表示方法得到了确立。本文的主要贡献之一是为$\varphi^4$模型开发了一种相应的几何表示方法,称为随机纠缠电流表示。
二面体群的Graham重排
Graham的一个著名猜想指出,任意集合$A \subseteq \mathbb{F}_p \setminus \{0\}$均可排列,使得所有部分和均互不相同。Bedert和Kravitz证明了当$|A| \leq e^{c(\log p)^{1/4}}$时该结论成立。本文将采用类似方法,在二面体群$Dih_{p}$的情形下得到相同类型的上界。
高频比特币数据算法投资策略中的Informer应用
本文研究了利用Informer架构构建高频比特币数据自动化交易策略的方法。提出了三种采用不同损失函数(均方根误差RMSE、广义平均方向性损失GMADL和分位数损失)的Informer模型策略,并将其与买入并持有基准策略以及基于技术指标的两个基准策略进行了评估。评估使用了多种频率的数据:5分钟、15分钟和30分钟间隔,覆盖了6个不同的时间段。尽管采用分位数损失的Informer模型未能超越基准,但另外两种模型表现更优。当使用更高频率数据时,采用均方根误差损失的模型性能下降,而采用新颖的广义平均方向性损失函数的模型则从更高频率数据中受益,在基于5分钟间隔训练时,该模型在大多数测试阶段击败了其他所有策略。本研究的主要贡献在于应用和评估了Informer模型结合均方根误差、广义平均方向性损失及分位数损失函数对未来收益进行预测,并以此开发自动化交易策略。研究表明,使用广义平均方向性损失函数训练的Informer模型相较于买入并持有策略可以带来更优的交易结果。
ModeSeq:利用序列模式建模驯服稀疏多模态运动预测
预测未来事件的多模态性为安全的自动驾驶奠定了基础。然而,交通参与者的多模态运动预测一直受到缺乏多模态真实数据的困扰。现有方法大多采用胜者全得的训练策略来应对这一挑战,但仍存在轨迹多样性有限和模式置信度不准确的问题。一些方法通过生成过多的轨迹候选来解决这些局限性,但需要一个后处理阶段来识别最具代表性的模式,这一过程缺乏通用原则且会损害轨迹准确性。因此,我们提出了ModeSeq,这是一种新的多模态预测范式,将模式建模为序列。与一次性解码多个可能轨迹的常见做法不同,ModeSeq要求运动解码器逐步推断下一个模式,从而更明确地捕捉模式之间的相关性,并显著提升对多模态性的推理能力。利用序列模式预测的归纳偏置,我们还提出了Early-Match-Take-All(EMTA)训练策略,进一步提高轨迹多样性。无需依赖密集的模式预测或启发式后处理,ModeSeq在显著提升多模态输出多样性的同时保持了令人满意的轨迹准确性,在运动预测基准测试中实现了平衡性能。此外,ModeSeq自然具备模式外推的能力,当未来高度不确定时能够支持预测更多行为模式。
智能网卡上的可靠复制协议
当前的数据中心应用程序依赖于需要提供高可用性、一致性和性能的数据存储。为了实现高可用性,这些数据存储会在多个节点间复制数据。这种复制通过可靠的协议管理,该协议使用一致性模型保持副本的一致性,即使在出现故障的情况下也是如此。对于许多应用而言,强一致性模型比弱一致性模型更受欢迎,因为前者为客户端提供了更直观的行为保证。此外,为了满足高在线流量的需求,数据存储必须提供高吞吐量和低延迟。然而,同时提供强一致性和高性能具有挑战性。可靠的复制协议通常需要在网络堆栈中进行多轮通信,这会引入延迟并增加网络资源的负载。此外,这些协议消耗大量的CPU资源,影响应用程序的整体性能,特别是在高吞吐量环境中。在这项工作中,我们旨在设计一种硬件加速系统来解决这些问题。我们尝试将复制协议卸载到智能网卡(SmartNIC)上,智能网卡是一种可编程的专用网络接口卡,可以直接在NIC上实现自定义逻辑。通过这种方式,我们旨在提升性能的同时保持强一致性,并节省宝贵的CPU周期用于应用程序的逻辑。
一维玻色气体的精确能谱函数
完全可解模型为强关联体系中的多体现象提供了严格的理解。本文报道了在揭示量子可积Lieb-Liniger模型普遍的多体关联性质方面的突破。我们通过一种新开发的方法计算形式因子,从而精确地求出动态关联函数,这种方法使我们能够以高精度计算基态或有限温度状态下所有可能的“相对激发”。由此得到的模型完整能谱函数在能谱阈值处表现出独特的幂律奇异性行为,证实了非线性Luttinger液体理论的有效性。我们的方法推进了动力学关联函数理论在热力学极限下的高精度发展,并能够用于验证此类新型关联性质的实验观测结果。
非局部自由边界问题的平坦性改进
本文首次研究了一类由一般非局部算子驱动的一相自由边界问题的自由边界正则性。我们的主要结果表明,自由边界在规则点附近是$C^{1,\alpha}$光滑的,并且规则自由边界点集是开集且在整个集合中稠密。此外,在二维情况下,我们对所有爆破极限进行了分类,并证明了自由边界处处为$C^{1,\alpha}$光滑。我们证明的主要技术工具是一种平坦性改进方案,该方案在粘性解的一般框架下建立,并具有独立的研究价值。这些结果仅对分数拉普拉斯算子已知,对于一般的非局部算子而言完全是新的。与之前关于分数拉普拉斯算子的工作不同,我们的证明方法本质上是非局部的。
标准模型有效场论中的手征反常消除与中性三规范玻色子顶点
我们展示了标准模型有效场论(SM EFT)中手征反常的消除,通过在含有维数-6算符插入的三角图中保持动量分配的一致性实现。通过强制规范不变性和Bose对称性,我们证明了Goldstone玻色子贡献可以抵消由大质量规范玻色子顶点产生的反常,从而保持SM EFT的一致性。我们计算了一圈下单个中性三规范玻色子顶点,揭示了在有效场论截止能标以下的所有能量范围内,维数-6算符的贡献占主导地位。一个包含重矢量电子的UV完备无反常模型验证了我们的方法,说明了重费米子的解耦如何生成SM EFT算符的同时保持反常消除。我们的结果强调了这些顶点在对撞机上探测新物理的物理相关性,特别是通过尺度为质心能量平方倒数1/s的维数-6效应,为实验检测提供了可行路径。
普遍局部化、Atiyah猜想与群的图
设 $ G $ 是一个可数群,并且是具有有限边群和顶点群的图的群的基本群,这些顶点群在 $ K \subseteq \mathbb{C} $( $ K $ 是闭合于复共轭的域)上满足强Atiyah猜想。假设 $ G $ 的有限子群的阶数有界。我们证明 $ G $ 在 $ K $ 上满足强Atiyah猜想。特别地,这表明强Atiyah猜想在自由积下保持封闭。此外,我们证明了 $ K[G] $ 在 $ \mathcal{U}(G) $ 中的 $ \ast $-正则闭包 $ \mathcal{R}_{\small K[G]} $ 是与该图的群相对应的图的环的普遍局部化,其中环是相应的 $ \ast $-正则闭包。由此得出结论:如果边群为有限群,则在图的群构造下, $ K $ 上的代数和中心值Atiyah猜想也保持封闭。我们还推导出一些关于 $ \mathcal{R}_{\small K[G]} $ 的 $ K_0 $ 和 $ K_1 $-群结构的结论。所发展的技术允许我们证明,如果 $ G $ 属于某些特定类别的群 $ \mathcal{T}_{\small \mathcal{VLI}} $ (包含特别是具有局部指示性的拟自由群的基本群),则 $ K[G] $ 满足强、代数和中心值Atiyah猜想,并且 $ \mathcal{R}_{\small K[G]} $ 是 $ K[G] $ 在所有在 $ \mathcal{U}(G) $ 中变为可逆矩阵的集合上的普遍局部化。
利用冻结的单模态编码器实现灵活的多模态对齐
近期对比学习的多模态视觉-语言模型(如CLIP)展示了强大的开放世界语义理解能力,已成为视觉-语言应用的标准图像骨干网络。然而,近期研究表明,训练良好的单模态编码器之间存在较高的语义相似性,这引发了一个关键问题:是否存在一种合理的方法将单模态骨干网络连接起来用于视觉-语言任务?为了解决这一问题,我们提出了一种新颖的框架,利用冻结的单模态编码器实现视觉和语言的对齐。该框架包括在潜在空间中选择语义相似的编码器、构建富含概念的图像-标题配对数据集以及训练简单的MLP投影器。我们在12个零样本分类数据集和2个图像-文本检索数据集上评估了我们的方法。我们最佳的模型采用DINOv2和All-Roberta-Large文本编码器,在ImageNet上的准确率达到76%,与从头开始训练的多模态对齐模型相比,数据需求减少了20倍,计算资源需求减少了65倍。所提出的框架提高了多模态模型开发的可访问性,同时实现了在不同场景中的灵活适应。代码和构建的数据集可在\texttt{github.com/mayug/freeze-align}获取。
美感测量仪:基于15个生命结构属性利用GPT评估建筑与城市美的工具
美感测量仪是一种由生成式预训练转换器(GPT)技术驱动的新工具,旨在评估建筑与城市之美。该工作基于克里斯托弗·亚历山大关于中心的理论,认为所有环境在不同程度上都具有内在的生命感。亚历山大识别了15个基本特性,如尺度层次和厚边界,这些特性构成了生命结构的特点,而美感测量仪以此为基础进行分析。通过整合GPT先进的自然语言处理能力,美感测量仪评估一个结构在多大程度上体现了这15个特性,从而实现对建筑与城市美学的细致评价。借助ChatGPT,该工具帮助用户生成对空间感知美丽与连贯性的见解。我们进行了系列案例研究,评估了建筑与城市环境、地毯、绘画及其他艺术品的图像。结果表明,美感测量仪在分析不同背景下的审美品质方面表现出有效性。我们的研究结果表明,通过利用GPT技术,美感测量仪为建筑师、城市规划师和设计师提供了一种强大的工具,以创造能够深深引起人们共鸣的空间。本文还探讨了此类技术对建筑和城市设计的影响,强调其在提升设计过程和评估建成环境方面的潜力。关键词:生命结构、结构性美、克里斯托弗·亚历山大、设计中的AI、以人为中心的设计
IGEV++:用于立体匹配的迭代多范围几何编码体
立体匹配是许多计算机视觉和机器人系统的核心组成部分。尽管在过去十年取得了显著进展,但在病态区域处理匹配歧义以及大视差问题仍然是一个开放性的挑战。本文提出了一种新的深度网络架构,称为IGEV++,用于立体匹配。所提出的IGEV++构建了多范围几何编码体(MGEV),该体对病态区域和大视差进行粗粒度几何信息编码,并对细节和小视差进行细粒度几何信息编码。为了构建MGEV,我们引入了一个自适应块匹配模块,能够高效且有效地计算大视差范围和/或病态区域的匹配成本。我们进一步提出了选择性几何特征融合模块,以自适应地融合MGEV中的多范围和多粒度几何特征。然后,我们将融合后的几何特征索引并输入到ConvGRUs中,以迭代更新视差图。MGEV能够高效处理大视差和病态区域(如遮挡和无纹理区域),并在迭代过程中具有快速收敛的优势。我们的IGEV++在Scene Flow测试集的所有视差范围内均表现最佳,最大可达768像素。此外,IGEV++在Middlebury、ETH3D、KITTI 2012和2015基准测试中也达到了最先进的准确性。具体而言,在Middlebury的大视差基准测试中,IGEV++的2像素异常值率(Bad 2.0)为3.23%,相比RAFT-Stereo和GMStereo分别减少了31.9%和54.8%的错误。我们还展示了IGEV++的一个实时版本,在KITTI基准测试中所有已发表的实时方法中表现最佳。代码已在https://github.com/gangweiX/IGEV-plusplus公开发布。
Open-Sora 2.0:在20万美元预算内训练商业级视频生成模型
过去一年,视频生成模型取得了显著进展,AI视频质量不断提升,但代价是模型规模更大、数据量增加以及对训练算力的需求更高。本报告介绍了Open-Sora 2.0,这是一个仅花费20万美元便训练完成的商业级视频生成模型。通过该模型,我们证明了训练顶级视频生成模型的成本具有高度可控性。我们详细阐述了所有促成这一效率突破的技术,包括数据整理、模型架构、训练策略以及系统优化。根据人类评估结果和VBench评分,Open-Sora 2.0 的性能与开源的 HunyuanVideo 和闭源的 Runway Gen-3 Alpha 等全球领先的视频生成模型相当。通过完全开源 Open-Sora 2.0,我们旨在让先进视频生成技术惠及更多人,推动内容创作领域的更广泛创新与创造力。所有资源均可在以下地址获取:https://github.com/hpcaitech/Open-Sora。
大型语言模型在自动评分西班牙语开放式问题中的有效性研究
评分是一项耗时且繁重的任务,教育工作者必须面对这一挑战。它是重要的任务,因为它为学习者提供反馈信号,并已证明及时反馈可以改善学习过程。近年来,大型语言模型(LLMs)的出现揭示了自动评分的有效性。本文探索了不同LLMs及其提示技术在自动评分开放式问题短文本答案方面的表现。与大多数文献不同,我们的研究聚焦于一个问题场景,即问题、答案和提示均为西班牙语的情况。实验结果表明,高级LLMs(开源和专有)在准确度、精确度和一致性方面表现出良好的性能。结果对提示风格非常敏感,表明存在对某些词汇或内容的偏向性。然而,最佳的模型与提示策略组合在三级评分任务中的准确率始终超过95%,当简化为二元正确或错误的评分问题时,准确率甚至上升到超过98%,这展示了LLMs在教育应用中实现此类自动化潜力。
高效计算拥塞匿名动态网络中的问题
匿名动态网络是由不可区分的过程组成的网络,其通信链路会随时间不可预测地出现或消失。先前的研究表明,在这些过程中确定性地计算多集输入值的任意函数仅需要线性的通信轮数(Di Luna-Viglietta, FOCS 2022)。然而,匿名动态网络的快速算法依赖于构建和传输称为“历史树”的大型数据结构,其大小为过程数量的多项式。如果网络拥塞且只能通过其链路发送对数大小的消息,则这种方法不可行。由于过程的匿名性结合网络的动态特性,逐段发送大消息并不构成解决方案。此外,已知某些基本任务如所有节点间的令牌传播(通过单令牌转发)在拥塞网络中需要$\Omega(n^2/\log n)$轮次(Dutta等,SODA 2013)。在这项工作中,我们开发了一系列实用高效的技巧,使得可以在拥塞的匿名动态网络中使用历史树。我们展示了如何在这种网络中以$O(n^3)$的通信轮数计算任意函数,大大改进了先前拥塞网络的最佳算法。
训练推理模型时长度比难度更重要
难题通常会导致较长的推理轨迹,因此被广泛认为是提升推理模型性能的关键因素。然而,这类高挑战性的问题非常稀缺,限制了可用数据集的规模。本文提出了一种简单的方法来解除对问题难度的依赖。首先,我们通过实证研究表明,推理长度而非问题难度主要影响训练模型的性能。其次,我们发现了一个关于推理长度的缩放定律,表明随着推理数据长度的增长,模型性能以对数线性方式提高。最后,我们介绍了一种生成任意长度推理数据的简单技术,并证明合成数据对训练推理模型有效。在我们的Long1K数据集上微调Qwen2.5-32B-Instruct语言模型后,我们提出了Long1K-32B模型,仅使用1,000个训练样本就实现了卓越的性能,在MATH上达到95.6%的准确率,在GPQA上表现优于DeepSeek-R1-Distill-Qwen-32B,达到71.1%的准确率。该模型、代码和数据集均已开源,可在https://huggingface.co/ZTss/LONG1获取。
使用JWST/NIRSpec对明亮且遥远宇宙的完整普查:RUBIES计划
我们介绍了红未知:亮红外星系巡天(RUBIES),它提供了来自UDS和EGS区域公共JWST/NIRCam成像数据中选定的红色源的JWST/NIRSpec光谱观测。RUBIES采用了一种新颖的观测策略,能够很好地量化选择函数:该巡天优化为达到高(>70%)完整性,针对的是非常罕见的明亮且红色(F150W-F444W>2)的天体。为了将这些稀有天体置于上下文中,我们同时观测了一个红移范围在2到7之间的星系参考样本,其采样率与它们在F444W亮度、F150W-F444W颜色和测光红移三维空间中的数密度呈反比关系。总计,RUBIES使用PRISM和G395M分光仪观测了约3000个目标,红移范围为$1<z_{phot}<10$;并且仅使用G395M分光仪观测了约1500个红移$z_{phot}>3$的目标。RUBIES的数据揭示了一个高度多样化的红色源群体,其红移范围广泛($z_{spec}\sim1-9$),其测光红移的散射和异常值比例是类似亮度但不那么红色源的三倍。这种多样性从测光SED中并不明显。只有光谱观测显示这些SED包含了一系列具有尘埃遮蔽恒星形成、极端发射线、缺乏恒星形成表明早期熄灭以及明亮活动星系核的星系混合体。作为我们更广泛选择函数的第一个演示,我们将红色源和参考样本的恒星质量和零视向速度U-V颜色进行了比较:红色源在其所有红移范围内通常是更为质量较大的星系($M_*\sim10^{10-11.5} M_\odot$)。然而,我们发现最庞大的系统在U-V颜色上跨越了很宽的范围。我们描述了我们的数据分析程序和数据质量,并通过DJA公开发布了RUBIES调查前半部分的归档数据和经过验证的光谱红移。
具有自适应模型再校准的动态分配超网络在FCL中的应用
联邦连续学习(Federated Continual Learning, FCL)为联邦学习(Federated Learning, FL)在现实场景中的适用性提供了一种新兴模式,在该模式下,任务在客户端之间动态且异步地演化,尤其是在医疗场景中。现有基于服务器端的FCL方法本质上通过客户端聚合涉及的所有任务来构建一个可连续学习的服务器模型。然而,这些方法面临以下挑战:(1) 对于之前已学习任务的灾难性遗忘,导致服务器模型中错误累积,难以维持对所有任务的全面知识。(2) 不同客户端处理异步任务时产生的偏置优化,导致不同客户端在相同时间步长上的优化目标发生冲突。本文首次提出了一种新颖的面向医学领域的服务器端FCL模式——具有自适应模型再校准的动态分配超网络(\textbf{FedDAH}),旨在促进客户端间不同且动态的任务流下的协作学习。为缓解灾难性遗忘问题,我们提出了动态分配超网络(DAHyper),设计了一个不断更新的超网络,用于管理任务标识符与其相关模型参数之间的映射关系,从而实现客户端间模型的动态分配。针对偏置优化问题,我们引入了一种新颖的自适应模型再校准(AMR)方法,将历史模型的候选变化纳入当前服务器更新,并根据相似度为不同时间步长上的相同任务分配权重,以实现持续优化。在AMOS数据集上的大量实验表明,我们的FedDAH在具有不同任务流的站点上优于其他FCL方法。代码已公开:https://github.com/jinlab-imvr/FedDAH。
动态任务向量分组用于高效的多任务提示调优
多任务提示调优利用多个高资源源任务来提升低资源目标任务的表现。现有的方法要么一次性将所有源任务组合训练的软提示转移,要么仅转移一个“高度相似”的源任务。然而,我们发现最优的迁移性能往往来自源任务的某种组合,既非单一也非全部。此外,我们还发现,在迁移后的微调过程中,源任务与目标任务之间的相似性也会动态变化,这使得在初始阶段基于相似性计算的方法显得不足。为了解决这些问题,我们提出了一种名为动态任务向量分组(Dynamic Task Vector Grouping, DTVG)的方法,其核心思想包括:(1)使用任务向量而非软提示来衡量任务相似性;(2)基于“目标相似度”和“知识一致性”两个指标对最优的源任务组合进行分组;(3)在每次迭代步骤中动态更新组合。在不同设置下的26个自然语言处理数据集上的大量实验表明,DTVG能够有效地分组相似的源任务,同时减少负迁移现象,取得了当前最先进(state-of-the-art)的性能。
共 13511 条搜索结果
共 13511 条