Research

arXiv

分类

医院-居民模型用于模拟诸如学校选择、本科学生分配到学位课程等诸多重要问题。在此模型中，为项目分配固定的配额以限制可被指派的代理数量。受所有代理必须匹配的情景启发，我们提出并研究了一种广义容量规划问题，该问题允许在配额方面进行成本可控的灵活性。我们的设定是对医院-居民问题的扩展，其中项目具有常规配额以及相应的成本，表明超出初始配额匹配代理的成本。我们旨在计算一种能够匹配所有代理且基于偏好最优，并最小化局部或全局成本目标的匹配方案。我们证明了存在显著差异——最小化局部目标可以在多项式时间内解决，而最小化全局目标则是NP难的。从积极的角度来看，我们在一般情况和特定困难情况下分别提出了全局目标的近似算法。我们通过基于线性规划的算法实现了特殊困难情况下的近似保证。我们通过展示与算法结果相匹配的下界进一步强化了NP难性。

数据结构与算法

2025-03-30 发布

本文深入研究了网络中的分布式聚合优化问题。在此场景下，每个代理拥有自身的局部成本函数，该函数不仅依赖于局部状态变量，还依赖于所有代理状态变量的聚合函数。为加快优化过程，我们将重球法和Nesterov加速方法与分布式聚合梯度跟踪相结合，提出了两种创新算法，旨在解决分布式聚合优化问题。我们的分析表明，当目标函数强凸且梯度具有Lipschitz连续性，并且参数（如步长和动量系数）在特定范围内选择时，所提出的算法可以以全局线性收敛率收敛到最优解。此外，我们通过若干数值实验验证了所提出算法的有效性、鲁棒性和优越性。

优化与控制

2025-03-30 发布

使用调和超空间方法，我们对高阶导数$6D$，${\cal N}=(1,0)$超对称Yang-Mills理论在伴随表示中超多重态耦合情形下的发散结构进行了全面研究。在超场背景场方法框架下，借助保留理论所有对称性的${\cal N}=(1,0)$超对称高阶导数正则化方案构建了有效作用量。以显式规范不变且$6D$，${\cal N}=(1,0)$超对称的形式计算了一圈发散，并希望其能推广到更高圈阶。分析了一圈近似的$\beta$-函数。特别地，表明对于任意调节函数的一圈$\beta$-函数由动量空间中的双重全导数积分给出，这与$4D,\, {\cal N}=1$超场规范理论中的情况类似。这指出了在所考虑的理论中推导出类似NSVZ全圈精确$\beta$-函数的可能性。

高能物理-理论

2025-03-30更新2025-03-24 发布

本文提出了一种利用特征算符（CO）${\cal \hat{D}}_{n_{\gamma}, n_{\beta}}$ 的新方法，扩展了PMC（基于重整群方程的公理化理论）的应用范围，这是对之前PMC单尺度设定方法的理论推广。通过CO形式化框架，我们能够在结构化的理论框架内推导复杂情形，从而简化过程并获得更紧凑的表达式。CO框架不仅简化了复杂情形的推导，还通过同时固定$\alpha_s$的有效值及其运行质量，实现了方案和尺度不变的微扰量子色动力学（pQCD）级数，这些结果与级数的展开系数一致，从而得到所需的方案和尺度不变的共形级数。作为一个例子，我们在$\overline{\rm MS}$-方案下展示了尺度不变的N$^{4}$LO总衰变宽度$\Gamma(H\to b\bar{b})$的结果。利用CO框架，其有效耦合$\alpha_{s}(Q_{*})$和有效$b$夸克的$\overline{\rm MS}$-质量$\overline{m}_{b}(Q_{*})$通过吸收从$\alpha_s$或$\overline{m}_{b}$的重整群方程中的所有非共形$\{\beta_{i}\}$-项同时确定。PMC尺度被固定到N$^3$LL精度，$Q_{*} = 55.2916$ GeV，得到了尺度不变的总衰变宽度$\Gamma(H \to b\bar{b}) = 2.3819 _{-0.0231}^{+0.0230}$ MeV，其误差为$\Delta \alpha_{s}(M_{Z}) = \pm 0.0009$，$\Delta M_{H} = 0.11$ GeV，$\Delta \overline{m}_{b}(\overline{m}_{b}) = \pm 0.007$ GeV以及未计算的N$^{5}$LO贡献$\Delta\Gamma= \pm0.0001$ MeV的平方平均值，这些预测是基于贝叶斯分析得出的，置信度为95.5%。

高能物理-唯象学

2025-03-30更新2024-11-23 发布

我们展示了通过JWST NIRSpec光谱成像对四个边缘盘状原行星盘喷流的观测结果，这些喷流明显表现出磁流体力学盘风的特征。双极喷流在超过30条激波激发的禁线、多条原子氢的帕邢系和布喇开特系谱线以及高能激发的原子氦（1.083微米）线中被检测并空间分辨出来。氦线在HH 30和FSTauB中是最亮的喷流示踪剂，这两者在所有示踪剂（包括[Fe II]和[He I]线）中均显示出红移和蓝移瓣之间的不对称强度。消光图未显示瓣间显著差异，表明喷流发射机制不对称而非环境效应。诊断线比值得出一致的激波速度为50-60公里/秒，喷流电离分数为0.1-0.2，预激波电子密度为1000/cm³。结合逐像素电子密度图和[Fe II]线亮度，我们使用三种独立方法估算喷流的质量损失率，平均约为每年几个10^(-9)太阳质量。我们估计这些源的吸积率为喷流质量损失率的10倍，并发现其与塔乌斯恒星形成区其他II类源的独立推导吸积率相匹配。由于JWST的高精度，我们还研究了喷流摆动现象，发现Tau 042021展示了镜像对称摆动的完美案例，这只能由喷流源围绕恒星伴星运动解释。通过对这种摆动建模，我们推测Tau 042021中心存在0.33和0.07太阳质量的双星系统，双星分离为1.35天文单位，轨道周期为2.5年。

地球与行星天体物理学

太阳和恒星天体物理学

2025-03-30 发布

我们提出了一种系统的方法，用于解析计算相对论探测粒子在库仑场和Schwarzschild背景下的时变可观测量。该方法生成的表达式在有界和无界区域均有效，即有界-无界普适表达式。为了展示我们的方法，我们计算了相对论运动在库仑背景下的时变半径和方位角（相对论开普勒运动），以及由相对论开普勒源辐射的电磁场。所有计算均表现出有界-无界普适性。最后，我们给出了Schwarzschild背景下半经典波函数的精确表达式。后者对于将我们的方法应用于Schwarzschild背景下的探测极限运动的任何时变可观测量至关重要，并且可以达到任意阶的速度和引力常数$G$精度。

广义相对论与量子宇宙学

高能物理-理论

2025-03-30 发布

棒结构在星系的定常演化中具有重要意义。本研究旨在探讨为何在红移 $z=0$ 时有些星系存在棒结构而其他星系不存在的原因。我们利用椭圆拟合方法测量了IllustrisTNG宇宙学模拟中的棒结构属性及其演化过程。通过使用K-S两样本检验以及追踪其演化变化，分析了有棒与无棒星系之间的参数差异。此外还研究了短棒星系的特性。追踪所有 $z=0$ 处的盘状星系回溯到 $z=1$ 时，它们在 $z=1$ 时都显示出类似的棒特征。在 $z=1-0$ 的演化过程中，有棒星系和短棒星系的棒结构比例增加，而无棒星系的比例减少。对于恒星质量 $\log(M_*/M_\odot)>10.8$ 的盘状星系，养育效应（主要是并合事件）在抑制或破坏棒结构方面起主导作用。经历较少并合事件的星系中棒结构更有可能持续存在，这可以通过较小的恒星晕质量和外源质量分数来量化。大约60%的本地宇宙中的无棒星系曾经拥有过棒结构。相比之下，由于星系结构不够紧凑导致对棒不稳定性响应不足（较大的Toomre-Q参数），在恒星质量 $\log(M_*/M_\odot)<10.8$ 的无棒盘状星系中起到了重要作用。此外，短棒通常与正常棒同时形成，在此期间它们要么轻微增长，要么显著收缩。IllustrisTNG模拟中产生过多短棒的事实表明，IllustrisTNG星系中心区域的动力学特性受外部因素（如并合和气体流入）的影响较小。

星系天体物理学

2025-03-30更新2024-12-03 发布

视觉指令微调（VIT）已成为使多模态大语言模型（MLLMs）能够熟练遵循用户指令的关键技术。然而，对于高质量指令微调数据的属性以及其自动化选择框架的理解仍存在显著差距。为了解决这一问题，我们提出了MLLM-Selector，这是一种通过权衡必要性和多样性来识别VIT中有价值数据的自动化方法。我们的过程从VIT数据池中随机采样一个子集以微调预训练模型，从而创建一个具有初步指令跟随能力的种子模型。然后，利用该种子模型，计算VIT数据池中每个样本的必要性得分，以确定对提升模型性能至关重要的样本。研究结果强调了在数据选择中混合必要性和多样性的的重要性，这促使我们开发了MLLM-Selector，一种融合必要性评分与策略性采样的方法以实现更优的数据精炼。实验结果显示，在相同实验条件下，MLLM-Selector在某些基准测试中仅使用不到1%的数据就超过了LLaVA-1.5，并且在使用少于50%的数据时，在所有验证的基准测试中始终表现出色。

计算机视觉与模式识别

2025-03-30更新2025-03-26 发布

Vintage因子分析是一种重要的因子分析类型，其目标是首先找到原始数据的低维表示，然后通过旋转使旋转后的低维表示具有科学意义。最广泛使用的Vintage因子分析方法是主成分分析（PCA）后接varimax旋转。尽管其广受欢迎，但由于varimax旋转需要在正交矩阵集合上解决非凸优化问题，目前几乎无法提供理论保证。本文提出了一种消减正交旋转程序，该程序依次求解正交矩阵的每一行。除了计算上的净收益和灵活性外，我们还能够在更广泛的背景下完全建立所提出程序的理论保证。采用这种新的消减正交旋转作为PCA后的第二步，我们在一般因子模型类下进一步分析了这一两步过程。我们的结果显示，当信噪比（SNR）适中或较大时，它以渐近最优速率估计因子载荷矩阵。在低信噪比情况下，当因子模型下的附加噪声具有结构时，我们展示了改进PCA和消减正交旋转的可能性。修改后的程序在所有信噪比范围内都被证明是渐近最优的。我们的理论适用于有限样本，并允许潜在因子数量随样本量增长，以及允许环境维度随样本量增长甚至超过样本量。大量的模拟和真实数据分析进一步证实了我们的理论发现。

2025-03-30更新2023-10-16 发布

Heilmann-Lieb定理是代数组合学中的一个基本定理，它提供了图匹配多项式零点分布的刻画。本文建立了超图版本的Heilmann-Lieb定理：设$\h$为最大度数${\Delta}\geq 2$的连通$k$-超图，$\mu(\h, x)$为其匹配多项式。我们证明了$\mu(\h, x)$的零点（包括重数）在复平面上绕原点旋转角度$2\pi/{\ell}$后保持不变，其中$\ell$为某个正整数，而$k$是具有此性质的最大整数。进一步地，我们证明了$\mu(\h, x)$的所有零点中最大模数$\lambda(\h)$是$\mu(\h, x)$的单根，并满足$$\Delta^{\frac{1}{ k}} \leq \lambda(\h)< \frac{k}{k-1}\big((k-1)(\Delta-1)\big)^{\frac{1}{ k}}.$$为了得到这些结果，我们证明了$\mu(\h, x)$整除$\h$的$k$-步树的匹配多项式，从而将Godsil的一个经典结果推广到超图情形。

组合学

2025-03-30更新2022-06-20 发布

基于文本提示或图像的视频生成与编辑取得了显著进展，但仅通过文本准确控制全局布局和几何细节以及通过图像支持运动控制和局部修改仍面临挑战。本文旨在实现基于草图的空间和运动控制以进行视频生成，并支持真实或合成视频的精细编辑。基于DiT视频生成模型，我们提出了一种具有草图控制块的记忆高效控制结构，该结构预测跳过DiT块的残差特征。草图绘制在一个或两个关键帧（任意时间点）上，便于交互。为将这种时间稀疏的草图条件传播到所有帧，我们提出了帧间注意力机制来分析关键帧与每个视频帧之间的关系。对于基于草图的视频编辑，我们设计了一个额外的视频插入模块，以保持新编辑内容与原始视频的空间特征和动态运动之间的一致性。在推理过程中，我们使用潜在融合以准确保留未编辑区域。大量实验表明，我们的SketchVideo在可控的视频生成和编辑方面表现出色。

计算机图形学

计算机视觉与模式识别

2025-03-30 发布

随着大型语言模型（LLMs）处理的任务日益复杂且文档长度不断增加，其在推理过程中的计算和内存成本已成为主要瓶颈。为解决这一问题，我们提出了PromptDistill，这是一种新颖的无需训练的方法，能够在保持生成质量的同时提高推理效率。PromptDistill通过利用早期层中的注意力交互，识别并保留最具信息量的令牌，并保存其隐藏状态，同时减少后期层的计算负担。这种方法使模型能够专注于关键上下文信息，而无需完全处理所有令牌。与之前的方法如H2O、SnapKV（这些方法仅在处理完整输入后进行压缩），或GemFilter（该方法固定选择初始提示的一部分而不考虑上下文依赖关系）不同，PromptDistill能够动态分配计算资源到最相关的令牌，同时保持对输入的整体感知。实验结果表明，采用我们的方法以及基线方法（如LLaMA 3.1 8B Instruct、Phi 3.5 Mini Instruct和Qwen2 7B Instruct）在LongBench、InfBench和Needle in a Haystack等基准测试中，PromptDistill显著提升了效率，且对输出质量的影响极小。通过单一阶段的选择策略，PromptDistill在性能和效率之间实现了有效平衡，优于先前的方法如GemFilter、H2O和SnapKV，因其具有更优的保留关键信息的能力。具体而言，相比GemFilter，PromptDistill总体性能提高了$1\%$至$5\%$，同时提供了更好的时间效率。此外，我们还探索了多阶段选择策略，进一步提升了效率，同时保持了较强的生成性能。

计算与语言

2025-03-30 发布

本文证明了对于$0<p,q,r<\infty$且$\frac{1}{q} = \frac{1}{p} + \frac{1}{r}$，形式为\[\pi_g(f) := \sum_{R \in \Dtwo} g_R \avr{f}{R} h_R\]的二进制抛物积算子从双参数二进制Hardy空间$\dyprodhp$到$\dotdyprodhq$的算子范数与$\dotdyprodhrn{g}$相当。我们还证明了对于所有$0 < p < \infty$，有\[\dyprodbmon{g} \simeq \|\pi_g\|_{\dyprodhp \to \dotdyprodhp}。\]对于具有相同形式的双参数傅里叶抛物积算子也得到了类似的结果。

函数分析

2025-03-30更新2024-08-15 发布

本文研究了在单台串行批处理机上同时最小化完工时间和最大成本的双目标调度问题。串行批处理机可以将最多$b$个工件组成一个批次进行加工，其中$b$被称为批容量。当开始一个新的批次时，机器需要固定长度的准备时间。在每个批次内，工件按顺序加工，因此批次的加工时间等于该批次中所有工件加工时间之和。批次中所有工件的完成时间相同，即批次的完成时间。主要结果是一个$O(n^3)$时间复杂度的算法，可以在批容量小于工件总数（有界模型）且不存在优先关系的情况下生成所有Pareto最优解。该算法也可以经过修改后在$O(n^3)$时间内解决批容量大于或等于工件总数（无界模型）且存在严格优先关系的情况。这一结果改进了之前针对有界和无界两种模型的最佳已知运行时间$O(n^4)$。

数据结构与算法

2025-03-30 发布

方法：我们开发了一套软件工具（DataSet Tracker），旨在实现实时分析，并可在计算机、智能手机和智能眼镜等硬件上运行，适合在无网络连接的显微镜下进行资源受限的即时计算；演示版本可在datasetanalysis.com查看。我们的目标是为研究社区提供一个集成且易于使用的工具，用于解析细胞骨架网格、细胞质膜网络及囊泡运输等复杂动态过程。该软件针对资源受限的计算环境进行了优化，甚至可以在无网络连接的显微镜上安装。结果：我们的计算平台能够对正在审批或处于临床前阶段的新化合物提供高通量分析和功能次级筛选，并提出基于FDA批准药物的潜在组合疗法。重要的是，通过定量解析药物作用机制，可以设计出能有效防止复发且具有最小有害副作用的最优剂量方案。结论：本文提出的实时光学流特征跟踪软件DataSet Tracker可作为现有和未来算法集成平台的基础模块，用于实时细胞分析。我们提出的计算分析方法可成功应用于评估任何人体器官的治疗策略。我们的目标是使这一集成工具获得临床实践的认可。

定量方法

2025-03-30更新2024-07-22 发布

本文提出了一种修正的多面体方法，用于提取决策者（DM）的非线性单变量效用函数，该方法不依赖于效用函数形状结构、Lipschitz模量以及拐点的显式信息。该方法受Toubia等人（2004年）提出的线性多变量效用提取方法的启发，并需克服两个主要困难才能取得成功。首先，我们利用连续分段线性函数（PLF）逼近非线性效用，并通过线性片段增量向量表示PLF。随后，非线性效用的提取对应于缩小增量向量的多面体可行集。其次，通过自适应生成新的查询（即对彩票进行成对比较），构造连续的超平面切割以减小多面体的规模，其中彩票参数通过求解一些优化问题获得。在此过程中，由于PLF近似误差可能导致切割超平面的方向误差。为解决这一问题，我们通过将新彩票的支持点添加到PLF的断点集中开发了一种策略。作为应用，我们将所有查询响应用于构建效用函数的模糊集合，允许基于最差情况下的效用做出决策，并在具有适当保守性减少方案的偏好鲁棒优化问题中应用修正的多面体方法。初步数值测试结果表明，所提出的方法表现良好。

优化与控制

2025-03-30 发布

对于定义在$\mathbb{R}^d$上的固定且紧支的概率测度$\mu$，我们研究了在Hausdorff 1-测度$\mathcal{H}^1(\Sigma)\leq l$的约束下，所有紧致、连通的$\Sigma\subseteq \mathbb{R}^d$上最小化$p$次幂平均距离泛函的问题。该问题被称为平均距离问题，最初由Buttazzo、Oudet和Stepanov在2002年提出，并受到了大量研究的关注。我们将通过分析之前由Hayase和两位作者引入的重心场方法，提供一种新颖的研究途径。这使得我们能够对当$p=2$以及$p>\frac{1}{2}(3+\sqrt{5})\approx 2.618$时任意维数下的极小化器提供完整的拓扑描述，这是首次包含$d>2$情形的结果。

优化与控制

概率论

2025-03-29 发布

本文首次研究了组合设计的失衡问题。具体而言，我们证明了对于每个固定的$r\geq 3$以及$n\equiv 1,3 \pmod{6}$的情况，任何对$[n]$上的三元组进行$r$-染色都存在一个阶数为$n$且失衡量为$\Omega(n^2)$的Steiner三元系统。但当$r=2$时，这一结论不成立；我们能够渐近刻画所有不含高失衡量的Steiner三元系统的二染色情况。在我们的证明过程中，关键步骤是对避免某种自然诱导子图的3-均匀超图进行特征化，这为超图的结构理论做出了贡献。

组合学

2025-03-29 发布

大型语言模型（LLMs）的最新进展使得信息检索（IR）管道可以通过多种方式利用合成数据进行增强。然而，主要的训练范式仍然保持不变：基于二元相关标签的对比学习和InfoNCE损失函数，其中一个正样本文档与一个或多个负样本文档进行比较。这一目标将所有未明确标注为相关的文档同等视为负样本，而不论其实际的相关程度如何，因此（a）忽略了对排序有用的细微差别，（b）容易受到标注噪声的影响。为了解决这一局限性，本研究完全放弃真实训练文档及其标注，而是利用开源LLMs直接生成针对真实用户查询的多个不同相关层级的合成文档。这种完全基于合成数据的分级相关性排名环境，结合适当的列表级损失函数（如Wasserstein距离），能够以更好的方式训练密集检索器，捕捉排序任务的本质。在各种IR数据集上的实验表明，我们提出的方案大幅优于传统的InfoNCE训练方法。无需使用任何真实文档进行训练，我们的密集检索器显著优于通过自监督训练的相同检索器。更重要的是，它与在同一数据集的真实标注训练文档上训练的相同检索器性能相当，同时对分布偏移更具鲁棒性，并且在零样本评估BEIR数据集集合时表现明显更优。

质子半径之谜是指在利用不同方法测量质子电荷半径时观察到的不一致现象。这一分歧引发了物理学界广泛的研究和讨论，因为它挑战了量子电动力学以及对质子基本性质的理解。在本研究中，我们通过零偏度下广义部分子分布（GPDs）的全局分析，确定了质子和中子的电荷和磁半径。我们强调同时分析所有与核子半径相关的可用实验数据的重要性，而不是依赖于单一实验、特定可观测量或有限的动量转移范围。这种全面的方法确保了结果的稳健性和一致性，避免了数值过小或过大的情况。我们的分析得出以下结果：$r_{pE} = 0.8558 \pm 0.0135~\mathrm{fm}$，$r_{pM} = 0.8268 \pm 0.0533~\mathrm{fm}$，$\langle r_{nE}^2 \rangle = -0.1181 \pm 0.0270~\mathrm{fm}^2$，以及 $r_{nM} = 0.8367 \pm 0.0845~\mathrm{fm}$。

高能物理-唯象学

高能物理-实验

高能物理-晶格

2025-03-29更新2024-08-03 发布

共 13511 条搜索结果

共 13511 条

医院-居民问题的广义容量规划

分布式聚合优化的加速算法

高阶导数超对称$6D$规范理论发散结构的研究

使用特征算符方法的尺度不变总衰变宽度 $Γ(H\to b\bar{b})$

使用JWST观测I类/II类喷流：质量损失率、不对称性和双星诱导的摆动

有界-无界普适性与Schwarzschild背景下的全阶半经典波函数

IllustrisTNG洞见：影响盘状星系中棒结构存在的因素

MLLM-Selector：基于必要性和多样性驱动的高价值数据选择以提升视觉指令微调效果

带有消减正交旋转的最优Vintage因子分析

超图版本的Heilmann-Lieb定理

草图视频：基于草图的视频生成与编辑

PromptDistill: 基于查询的中间层选择性保留令牌以提升大型语言模型推理效率

双参数Hardy空间上抛物积算子范数的研究

单台串行批处理机调度问题中使完工时间和最大成本同时最小化的改进算法

适用于资源受限计算环境的实时图像分析软件

修正多面体法在无形状约束效用提取及鲁棒优化保守性降低中的应用

一般维度下平均距离极小化问题的结构

高失衡的Steiner三元系统

超越对比学习：合成数据实现多层级相关性的列表级训练

从广义部分子分布确定核子的电荷和磁半径