Research

arXiv

分类

我们研究了$\mathbb R^n$中测度的Reifenberg定理的推广，假设了Jones的$\beta$-数，这些数适当衡量了支撑集接近包含在子空间的程度。我们的主要结果适用于一般测度而不需密度假设，给出了$\mu$在远离一个闭合$k$-可求长集的有效测度界，该集合具有有界的Hausdorff测度。我们通过例子展示了结果的sharp性。在进一步的密度假设下，可以将其转化为$\mu$的整体测度界和$k$-可求长结构。应用包括集合和离散测度上的定量Reifenberg定理，以及满足所有尺度$\beta$-数估计的测度上的Ahlfor正则性上界估计。

经典分析与常微分方程

PDE分析

微分几何

2025-03-24更新2016-12-23 发布

我们提出了一种高效的实时量子动力学模拟方法，即投影变分量子动力学（PVQD），通过在每个时间步长仅战略性地优化变分参数的子集来降低计算成本。通常情况下，变分基态由重复的参数化量子电路块组成，所有参数都在标准优化过程中更新。相比之下，我们的方法每次只选择性地优化一个块，同时固定其他块，从而显著减少了计算开销。这种半全局优化策略确保了所有量子比特仍参与演化过程，但优化被局部化到特定的块上，因此无需同时更新所有参数。我们提出了不同的选择下一块进行优化的方法，包括顺序、随机和基于保真度的更新方式。我们在一系列具有不同规模和复杂性的自旋晶格模型中展示了所提出方法的性能。我们的方法在大幅降低计算成本的同时保持了时间演化的准确性。这一新的优化策略为复杂量子系统的高保真时间演化模拟提供了减少计算资源消耗的可行路径。

量子物理

2025-03-24 发布

在图中，如果两个节点的第一邻域集合（排除这两个节点）相同，则称它们在拓扑上等价。我们证明，当位于一组拓扑等价节点上的非线性耦合振子形成完全连接子图（或这些子图的组合）时，它们可以轻松实现同步，且其他所有振子的状态不影响这种同步状态。更普遍地，图的其余部分发生的任何变化都不会改变该组的同步状态。典型情况下，当$k^{(\mathrm{OUT})} \leq k^{(\mathrm{IN})}$时，该组可以实现同步，其中$k^{(\mathrm{IN})}$和$k^{(\mathrm{OUT})}$分别是该组内每个节点的内部度和出度。模拟结果验证了我们的分析，并表明拓扑等价节点组起到了独立起搏器的作用。

设$C$为$\mathbb{Q}_p$上的代数闭完全赋值域，其整数环为$\mathcal{O}_C$，无穷小增厚为$\Ainf$。设$\mathfrak{X}$为$\mathcal{O}_C$上的半稳定形式概形，并固定其在$\Ainf$上的平坦提升$\widetilde{\mathfrak{X}}$。设$X$为$\mathfrak{X}$的通用纤维，$\widetilde{X}$为通过$\widetilde{\mathfrak{X}}$诱导的在$\BdRp$上的提升。设$\MIC_r(\widetilde{X})^{{\rm H}\text{-small}}$和$\rL\rS_r(X,\BBdRp)^{{\rm H}\text{-small}}$分别为$X_{\et}$上的秩$r$ Hitchin-小可积联络的$v$-叠层以及$X_v$上的$\BBdRp$-局部系统。本文通过引入一个新的带连接周期层$(\calO\bB_{\dR,\pd}^+, \rd)$，建立了这两个叠层之间的等价关系。

代数几何

数论

2025-03-24更新2024-09-13 发布

Erd\"os在1940年提出了一个极值问题，研究首一多项式$p$（其所有零点均位于单位闭圆盘内）的lemniscate $\{|p(z)|<1\}$的最小面积。本文证明了存在与次数$n$无关的正常数$c,C$，使得 \[ \dfrac{c}{\log n} \leq \min \text{Area}( \{ |p(z)|<1 \} ) \leq \frac{C}{\log \log n}, \] 显著改进了此前Pommerenke（1961年）得到的下界以及Wagner（1988年）得到的上界。我们还研究了内切圆半径（最大内切圆的半径），给出了内切圆半径与面积之间的估计，从而确认了Solynin和Williams在2009年的猜想，并由此给出内切圆半径的下界为$(n \sqrt{\log n})^{-1}$的量级，解决了Erd\"os、Herzog和Piranian在1958年提出的问题（证实了他们的猜想，误差仅为对数因子）。除了研究$\{|p(z)|<1\}$的面积外，我们还考虑了其他次水平集$\{|p(z)|<t\}$，当$t>1$时证明了上下界均为$1/\log \log n$的量级；当$0<t<1$时，得到了幂律的上下界。此外，我们还研究了一种更一般的约束下的最小面积问题，即用容量为1的紧集$K$替代单位圆盘，证明了当$n \rightarrow \infty$时最小面积趋于零（肯定回答了Erd\"os、Herzog和Piranian的另一个问题）；同时探讨了面积最小化多项式的结构，证明了归一化的零点计数测度在$n \rightarrow \infty$时收敛到$K$的平衡测度。

数据蒸馏已成为一种流行的压缩大规模数据集为更小且更高效表示的方法，同时保留模型训练所需的关键信息。数据特征大致可分为两类：实例特定特征，捕捉单个样本的独特细节；以及类别通用特征，代表跨类别的共享模式。然而，先前的方法往往难以平衡这些特征——一些仅关注类别通用模式，忽视了更细粒度的实例细节，而另一些则优先考虑实例特定特征，忽略了对类别理解至关重要的共享特性。本文提出了一种名为非关键区域优化数据蒸馏（NRR-DD）的方法，在合成数据中保留实例特定细节和细粒度区域的同时，用类别通用信息丰富非关键区域。这种方法使模型能够利用所有像素信息，捕获两种特征类型并提升整体性能。此外，我们提出了基于距离的代表性（DBR）知识迁移方法，通过依赖合成数据预测与独热编码标签之间的距离，无需软标签即可进行训练。实验结果表明，NRR-DD在小型和大型数据集上均实现了最先进的性能。此外，通过仅为每个实例存储两个距离，我们的方法在各种设置下提供了可比的结果。代码可在https://github.com/tmtuan1307/NRR-DD获取。

计算机视觉与模式识别

2025-03-24 发布

旋转机械的故障检测是一项复杂任务，特别是在小样本且数据异质性较高的场景下。传感器布置、机械配置以及结构差异等因素进一步增加了问题的复杂性。传统深度学习方法通常需要大规模同质数据集，限制了其在工业环境中数据匮乏场景下的适用性。虽然迁移学习和少量学习显示出潜力，但它们往往受限于对大量故障数据集的需求。本研究提出了一种统一框架，利用一种新型的渐进神经网络(PNN)架构来解决这些挑战。PNN通过利用之前估计的所有特征逐步估计更高阶的固定大小精炼特征，并将其附加到特征集中。每层固定的特征输出控制了PNN的复杂度，使其适合从少量数据中进行有效学习。该框架的有效性在八个数据集上得到了验证，包括六个开源数据集、一个内部故障模拟器和一个真实工业数据集。PNN在不同规模的数据集和机械类型下的故障检测中实现了最先进的性能，展示了卓越的泛化和分类能力。

机器学习

2025-03-24 发布

实践中模型常常出现误设，因此模型批评成为贝叶斯分析的关键部分。不仅需要判断模型是否错误，还需要明确哪些方面存在错误，并以计算方便且统计严谨的方式进行检测。本文提出了一种基于如下事实的新模型批评方法：如果参数从先验分布中抽取，数据集按照假设的似然函数生成，则后验样本将遵循先验分布。因此，可以通过检验后验样本是否可能由先验分布生成来检测假设的似然函数或先验分布的偏差。在此基础上，我们建议将似然函数和先验分布的所有随机元素重新参数化为独立的均匀随机变量（u值）。这使得可以聚合数据点和参数的任意子集的u值，利用经典的依赖性或非均匀性假设检验方法来测试模型偏差。我们通过多个示例实证展示了这种均匀参数化检验（UPCs）方法在模型批评中的有效性，并发展了相关的理论结果。

方法论

2025-03-24 发布

我们提出了一种通用框架，用于在成对比较中对玩家整体实力进行统计推断，允许协变量分布存在潜在变化。这些协变量捕获可能影响每个玩家获胜概率的重要上下文信息。我们通过目标分布的Kullback-Leibler投影来衡量玩家在目标分布下的整体实力，投影到一类调整协变量的Bradley-Terry模型类中。因此，我们的估计量在不施加严格模型假设的情况下仍然定义明确。我们开发了半参数有效的估计量及其对应的推断程序，允许灵活估计非关键函数。当条件Bradley-Terry假设成立时，我们还提出了不需要观察所有成对比较的额外估计量。我们在模拟研究中展示了所提出方法的表现，并将其应用于评估大型语言模型在现实应用中与人类偏好的一致性。

方法论

2025-03-24 发布

多种量子设备架构中的非局域相互作用使得能够在保持对噪声相同保护程度的前提下实现更紧凑的量子编码。预计长度较短至中等长度的码将很快得以实现，因此构建具有给定码距离的稳定子码显得尤为重要，这些码应能以最少数量的物理量子比特实现逻辑门的容错实现。为此，我们构造了三种编码单个逻辑量子比特的码，其距离可达31。首先，我们构造了已知最小的双重偶码，所有这些码都允许Clifford群的横向实现。通过对这些码应用加倍过程[arXiv:1509.03239]，得到了已知最小的相同距离和编码量子比特数的弱三重偶码。这一第二类码允许逻辑$\texttt{T}$-门的横向实现。放松三重偶性质后，我们获得了第三类三正交码，其代价是需要额外的Clifford门来实现相同的逻辑操作，但其开销更低。据我们所知，这些是各自距离下已知最小的三正交码。虽然这些码不是量子低密度奇偶校验码(qLDPC)，但具有横向$\texttt{T}$-门的码族的稳定子生成器权重大致与其长度的平方根成比例。

量子物理

信息论

数论

2025-03-24更新2024-08-22 发布

现代企业正面临数字身份前所未有的激增，机器身份的数量已显著超过人类身份。本文研究了我们定义为“人机身份模糊”所引发的网络安全风险——即人类身份与机器身份相互交叠、授权委托并产生新的攻击面的现象。通过行业数据、专家见解以及真实事件分析，我们识别出当前身份管理模型在治理方面的关键空白，这些模型将人类实体和机器实体视为独立的领域。为应对这些挑战，我们提出了一种基于四项核心原则的统一身份治理框架：将身份视为连续体而非二元区分，对所有身份类型进行一致的风险评估，实施由零信任原则指导的持续验证，并在整个身份生命周期内保持治理。研究表明，采用这一统一方法的组织在身份相关安全事件方面减少了47%的发生率，并在事件响应时间上提高了62%。最后，我们提供了实用的实施路线图，并概述了随着AI驱动系统日益自主化而需要进一步研究的方向。

密码学与安全

人工智能

2025-03-24 发布

来自各种来源的预训练语言模型（PLMs）是当今自然语言处理（NLP）进步的基础。这些模型学习的语言表征在来自不同来源且规模各异的数据集上表现出色。我们对低资源非洲语言的领域适应和任务适应连续预训练方法进行了全面分析，并展示了评估任务中的有前景结果。我们创建了AfriSocial语料库，该语料库经过精心的质量预处理设计，用于领域适应微调。使用AfriSocial作为领域适应预训练（DAPT）数据对PLMs进行连续预训练，在针对16种目标语言的细粒度情感分类任务上的宏F1分数提升了1%到28.27%。同样，通过任务适应微调（TAPT）方法，利用少量未标注但相似任务的数据进一步微调，也显示出有希望的结果。例如，未标注的情感数据（源任务）可使基础模型在细粒度情感分类任务（目标任务）的F1分数提升0.55%到15.11%。结合两种方法，即DAPT + TAPT，其性能优于基础模型。所有资源将公开，以改善低资源NLP任务以及类似的领域任务，如仇恨言论和情感分析任务。

计算与语言

2025-03-24 发布

子集和比问题（SSR）旨在给定一个正整数多重集合 $ A $ 的情况下，找到两个不相交的子集，使得它们的和的最大到最小比值最小化。本文研究了 $ k $ 版本的 SSR，即 $ k $-子集和比问题 ($ k $-SSR)，其目标是最小化 $ A $ 的 $ k $ 个不相交子集的和的最大到最小比值。我们开发了一个运行时间为 $ O({n^{2k}}/{\varepsilon^{k-1}}) $ 的近似方案，其中 $ n = |A| $ 且 $ \varepsilon $ 是误差参数。据我们所知，这是固定 $ k > 2 $ 时首个针对 $ k $-SSR 的完全多项式时间近似方案（FPTAS）。我们还提出了 $ k $-路数划分比问题 ($ k $-PART) 的一个 FPTAS，该问题与 $ k $-SSR 的区别在于 $ k $ 个子集必须构成 $ A $ 的划分。我们为 $ k $-PART 提出了一个更复杂的 FPTAS，同样达到了 $ O({n^{2k}}/{\varepsilon^{k-1}}) $ 的时间复杂度。值得注意的是，$ k $-PART 等价于具有相同估值函数的最小嫉妒比问题，在不可分物品公平分配的研究背景下已被研究过。当限制在相同估值的情况下，我们的 FPTAS 相较于 Nguyen 和 Rothe 的针对最小嫉妒比的 FPTAS 有显著改进，后者对于所有加性估值函数的时间复杂度为 $ O(n^{4k^2+1}/\varepsilon^{2k^2}) $。最后，我们为 $ k $-SSR 提出了一种第二种 FPTAS，它通过精心设计调用第一种方案实现；新的方案时间复杂度为 $ \widetilde{O}(n/{\varepsilon^{3k-1}}) $，因此当 $ n \gg 1/\varepsilon $ 时比第一种方案快得多。

数据结构与算法

F.2.2

2025-03-23 发布

使用螺旋磁场剖面增强轴子-光子转换在高轴子质量的实验室搜索中显示出巨大潜力。我们将这种被称为轴子-磁共振（AMR）的机制从激光实验扩展到轴子太阳望远镜，并展示了其在覆盖QCD轴子参数空间方面的潜力。具体而言，我们将AMR应用于CAST实验遗留问题，对即将进行的IAXO实验进行了预测，并评估了其对轴子类粒子和QCD轴子的影响。我们观察到在所有情况下，实验的灵敏度范围均有显著提升。

高能物理-唯象学

高能物理-实验

2025-03-23更新2024-08-20 发布

低金属丰度恒星保存了银河系早期核合成事件的特征，因为它们的表面丰度反映了其诞生时星际介质的组成。除了大爆炸核合成外，由于其短暂的寿命，大质量恒星主导了早期银河系星际介质中的抛射物质。其中大多数将以核心坍缩超新星（CCSN）爆炸的形式结束，而典型的抛射丰度分布（例如α元素与铁的比例）反映了这些贡献。几乎所有CCSN都会产生56Fe。因此，低金属丰度恒星可用于测试任何其他元素的丰度是否与铁的丰度相关联，即这些元素是否在祖源中与铁共同产生，或者是否需要不同的或额外的天体物理起源。本研究的重点是[Fe/H]<-2的恒星，因为它们探测了银河系最早的形成阶段，当时只有少数核合成事件向最低金属丰度恒星形成的气体贡献了其抛射物。这也是低质量和中间质量恒星（或Ia型超新星）尚未对任何额外重元素做出贡献的时代。在先前关于重r-过程元素起源工作的基础上[1]，我们扩展了当前研究，利用SAGA[2]和JINA[3]数据库中的高分辨率恒星光谱数据，考察了铁与锂、铍、碳、氮、钠、镁、硅、硫、钙、钛、铬、镍、锌、锗、硒、锶、锆、钡、铈、钐、铕、镱、镥、铪、锇、铱、铅、钍和铀之间的皮尔逊和斯皮尔曼相关性。主要目标是识别观测到的哪些元素(i)可能是在（可能是多种）CCSN中与铁共同产生的，以及哪些元素需要(ii)完全不同的，或至少(iii)额外的天体物理起源。

太阳和恒星天体物理学

星系天体物理学

2025-03-23 发布

我们提出了一种通用形式化方法，用于研究广义全息暗能量（HDE）模型，其中我们采用宇宙视界面积-熵的无量纲形式。尽管该形式化方法主要应用于未来的事件视界，但也可以推广到其他类型的视界。然后，我们利用这一形式化方法对标准HDE（即贝肯斯坦-霍金）的非延展性视界熵以及广义的Barrow/Tsallis-Cirto、Rényi、Sharma-Mittal和Kaniadakis模型进行分析，并通过宇宙学数据对其进行检验。我们确定了特定熵模型参数的范围，并应用贝叶斯证据准则等统计比较工具，以判断这些模型相对于标准ΛCDM模型的优劣。主要的数据测试结果表明，所有被研究的HDE模型在统计上均不支持ΛCDM模型，尽管程度有所不同。标准HDE模型的表现与Rényi、Sharma-Mittal和Kaniadakis HDE模型相当，因为后者的非延展性参数的级数展开仅导致与HDE模型的小偏差。然而，Barrow和Tsallis-Cirto模型虽然仍不如ΛCDM模型，但在观测上显示出满足可加性这一重要物理属性的趋势（尽管仍然保持非加性），这与我们之前的研究结果[Refs. \cite{Dabrowski:2020atl,PhysRevD.108.103533}]以及近期文献[\cite{TSALLIS2025139238}]的结论一致。最后，Tsallis-Cirto模型的参数指向ΛCDM极限，但其代价是具有比其他模型更大的全息暗能量无量纲参数k值。

若$f$为一个修改后的Dirichlet特征，即完全乘性函数，并且存在一个Dirichlet特征$\chi$，使得对于除了有限个素数$p \in S$之外的所有素数$p$都有$f(p) = \chi(p)$，而对于这些例外的素数$p \in S$有$|f(p)| \leq 1$。如果$\chi$是本原的，并且对每个$p \in S$都有$|f(p)| = 1$，我们证明了$\sum_{n \leq x} f(n) = \Omega((\log x)^{(|S|-3)/2})$。这在Klurman、Mangerel、Pohoata和Ter\"av\"ainen的一个猜想上取得了进展，详见《美国数学学会汇刊》374卷（2021年），第7967–7990页。我们的证明结合了解析数论、调和分析、Baker关于对数线性形式的理论以及均匀分布模1序列的不等式界限工具。

数论

2025-03-23 发布

由于其极为古老的梵文语言、诗歌结构以及庞大的文本量，《梨俱吠陀》的解读和理解面临非平凡的挑战。本研究通过自然语言处理（NLP）技术，识别了《梨俱吠陀》中赞歌的主题和语义联系，并得到了七组著名的赞歌分组的支持。Jamison 和 Brereton 的现代英语版《梨俱吠陀》中包含的 1,028 首苏克塔（赞歌）经过预处理后，分别采用以下方法获得苏克塔级别的嵌入：i) 本文提出的一种新颖的 LSA 改进方法；ii) SBERT；iii) Doc2Vec 嵌入。在对向量进行 UMAP 维度约简后，利用 k-最近邻算法构建了苏克塔网络。随后，采用 Louvain、Leiden 和标签传播方法对苏克塔网络中的主题进行了社区检测，并通过适当的零分布确定所形成主题的统计显著性。仅本文提出的改进 LSA 方法结合 Leiden 方法检测到的苏克塔主题网络具有显著性（z = 2.726，p < 0.01），模块化分数为 0.944。在分析的七组著名苏克塔分类（如创世、丧葬、水等）中，LSA 得出的网络在所有七种情况下均成功识别，而 Doc2Vec 未达到显著性且未能检测到相关苏克塔。SBERT 检测到四个著名的苏克塔作为独立组，但错误地将其中三个合并为一个混合组，且其网络不具有统计显著性。

计算与语言

2025-03-23 发布

考虑由高电压差$\lambda$产生的等离子体，这被称为汤森放电。我们假设它被限制在两个同心球面、两个同心柱面或更一般地限制在两个星形曲面之间的区域$\Omega$内。首先，我们证明如果等离子体最初相对稀薄，则它可能一直保持稀薄，也可能不保持稀薄，具体取决于某个参数$\kappa(\lambda, \Omega)$。其次，我们证明存在一个连接单一参数族的稳态解。这个族将未电离气体与等离子体连接起来，等离子体的击穿电压为$\lambda^*$或具有非常高的电离率，至少在圆柱形或球形情况下是如此。

PDE分析

数学物理

35M33, 35B32, 35B35, 76X05

2025-03-23更新2024-03-19 发布

这是关于扩展[ATW24]、[McQ20]和[Que22]中梦想主化和分辨率方法到拟卓越、对数以及相对设定的项目中的第一篇论文。我们证明了[ATW24]的主要结果可以推广到具有足够导子的正则概形，并且对于所有的正则态射都是函子性的。这已经足以正式推断出相同的结果适用于其他范畴，例如复解析空间和p进解析空间。我们的方法与[ATW24]有许多共同点，但重点现在转向加权中心及其坐标表示的研究。我们不仅希望这种方法更简洁且更具概念性，而且在后续研究中它也将很容易应用于对数和相对设定。

代数几何

2025-03-23 发布

共 13511 条搜索结果

共 13511 条

测度的定量Reifenberg定理

基于块优化的投影变分量子动力学（BLOP-VQD）：算法与晶格系统的实现

网络中受拓扑保护的同步现象

搭载$p$-进制黎曼-希尔伯特对应关系的堆叠层在Hitchin-小区域上的研究

关于多项式lemniscate的面积问题

通过非关键区域优化提升数据蒸馏方法

面向小样本约束下旋转机械故障分类的新型渐进神经网络(PNN)

基于均匀参数化检验的贝叶斯模型批评方法

针对协变量转移的高效Bradley-Terry模型推断方法

长度短且距离高的横向Clifford门和T门码

人机身份模糊：2025年网络安全风险管理的统一框架

面向非洲语言社交媒体文本的AfroXLMR-Social：预训练语言模型的适配研究

k-子集和比问题与多路数划分比问题的近似方案

利用轴子磁共振向QCD轴子靠近

通过星系考古揭示元素起源

基于宇宙学数据验证的广义非延展性熵全息暗能量模型

修改后Dirichlet特征的部分和的$Ω$-界 II

《梨俱吠陀》赞歌主题映射与概念组织：定量连接吠陀苏克塔

环形区域中的电离气体

梦想分辨率与主化 I：足够的导子