分类
Wigner次对角过程中的去相关转变
我们研究了Wigner次对角过程,即一个$N\times N$维Wigner矩阵$H^{(N)}$的特征值与其所有$n\times n$维次对角矩阵$H^{(n)}$($n\leq N$)的特征值。$H^{(N)}$的最大特征值与其直接次对角矩阵$H^{(N-1)}$的特征值非常强相关,但随着$k$增大,这种相关性对于更小的次对角矩阵$H^{(N-k)}$逐渐减弱。对于GUE次对角过程,在$k\sim N^{2/3}$附近的临界过渡区域已被Forrester和Nagao(《J. Stat. Mech.: Theory and Experiment》,2011年)分析,他们给出了非平凡联合相关函数的显式公式。我们证明了该公式具有普适性,即它适用于Wigner次对角过程。此外,我们全面分析了特征值及其对应的特征向量重叠在亚临界和超临界区域的行为,从而完整地证明了去相关转变的普适性。
超越对角可重构智能表面辅助MIMO干扰信道中的干扰最小化
本文提出了一种针对多输入多输出(MIMO)干扰信道(ICs)中超越对角可重构智能表面(BD-RIS)辅助的被动和主动波束成形的两阶段方法。在第一阶段,设计了被动的BD-RIS以最小化所有接收机的总干扰功率,该成本函数称为干扰泄漏(IL)。为此,我们提出了一个在酉矩阵流形上的优化算法以及一种次优但计算效率更高的解决方案。在第二阶段,用户根据不同的标准设计主动预编码器,例如最小化干扰泄漏(min-IL)、最大化信噪比(max-SINR)或最大化总速率(max-SR)。BD-RIS未消除的残余干扰被视为噪声。我们的仿真结果表明,与其它设计方案相比,max-SR预编码器可以提供超过20%的总速率提升,尤其是在BD-RIS具有中等数量的元素($M<20$)且用户以高功率传输时,此时残余干扰仍然显著。
近似求解Klee测度问题及并集体积估计的下界
并集体积估计是一个经典的算法问题。给定一组对象 \( O_1, \ldots, O_n \subseteq \mathbb{R}^d \),我们希望近似计算它们并集的体积。在特殊情况下,当所有对象均为盒子(也称为超矩形)时,该问题被称为Klee测度问题。现有最先进的算法[Karp, Luby, Madras '89]在常数维度 \( d \) 下,通过使用总查询次数 \( O(n/\varepsilon^2) \)(包括三种形式:(i) 查询 \( O_i \) 的体积;(ii) 从 \( O_i \) 中均匀采样一点;(iii) 查询某点是否包含于 \( O_i \))以常数成功概率提供了一个 \( (1+\varepsilon) \)-近似解。我们证明了如果只能通过上述三种查询方式与对象进行交互,则[Karp, Luby, Madras '89]的查询复杂度是最佳的,即 \( \Omega(n/\varepsilon^2) \) 次查询是必要的。我们的下界甚至适用于二维空间中等面积的轴对齐多边形的并集估计,并且即使允许算法检查从多边形中采样的点的坐标,仍然成立,即便允许查询任意未采样的点的包含关系。受此下界启发,我们为Klee测度问题提供了一种更高效的近似算法,将时间复杂度从 \( O(n/\varepsilon^2) \) 改进到 \( O((n+\frac{1}{\varepsilon^2}) \cdot \log^{O(d)}n) \)。通过利用Klee测度问题的几何特性,我们实现了这一改进:(1) 由于可以访问盒子的坐标,我们可以将盒子分为形状相似的类;(2) 在每一类中,我们展示了如何通过正交范围搜索从所有盒子的并集中采样;(3) 我们利用不同类别的盒子之间的小交集特性,对于大多数类对成立。
关于空间$L_{m+1,n}$的算术与几何
本文证明了关于特征为$p$的$\mathbb{F}_p$-向量空间$\log$微分形式的一些新结果,这些空间被称为“空间$L_{m+1,n}$”。在前两位作者工作的基础上,我们在许多情形下证明了存在空间$L_{m+1,n}$的正负结果,并且分类了$p=3$时的所有空间$L_{12,2}$和$L_{15,2}$。所使用的创新工具包括Moore行列式和计算代数。
密码扫描仪:分析现代软件中的密码用法
量子计算的兴起带来了重大挑战,因为它有可能破解某些密码算法,这需要采取积极措施来识别并现代化加密代码。在现有代码中识别这些加密元素只是第一步。不仅需要识别对量子计算脆弱的算法,还需要检测漏洞和错误的加密用法,以及对其进行优先级排序、报告、监控,并修复和现代化代码库。美国政府的一份备忘录要求各机构通过优先清点包括软件和硬件系统在内的加密系统开始向后量子密码学(PQC)过渡。本文描述了我们的代码扫描工具——密码扫描仪(Cryptoscope),它利用加密领域的知识以及编译器技术,静态解析和分析源代码。通过分析控制流和数据流,该工具能够构建可扩展且可查询的加密清单。密码扫描仪超越了识别孤立的加密API,而是为用户提供了一个包含全面视图的加密资产清单——即实现的加密操作。我们显示,在超过92%的测试用例中,这些视图包括加密操作本身、API以及相关的材料,如密钥、随机数、随机源等。最后,基于此清单,我们的工具能够在CamBench中检测并报告所有11个加密相关弱点和漏洞中的15个,达到了最先进的性能。
个体公平性的次二次时间近似算法
我们在个体公平性的背景下研究了$k$-中心问题。设$P$为度量空间中的$n$个点集,$r_x$为$x \in P$与其第$\lceil n/k \rceil$个最近邻的距离。该问题要求在优化$k$-中心目标的同时满足约束条件:对于每个点$x$,存在一个距离不超过$r_x$的中心。我们给出了双准则$(\beta,\gamma)$-近似算法,计算出的聚类结果使得每个点$x \in P$都有一个距离不超过$\beta r_x$的中心,并且聚类成本至多为最优成本的$\gamma$倍。我们的主要贡献包括一个确定性的时间复杂度为$O(n^2+ kn \log n)$的$(2,2)$-近似算法,以及一个随机化的时间复杂度为$O(nk\log(n/\delta)+k^2/\varepsilon)$的$(10,2+\varepsilon)$-近似算法,其中$\delta$表示失败概率。对于后者,我们开发了一种随机抽样过程,可以在次二次时间内计算所有$x \in P$对应的$r_x$的常数因子近似值;我们认为这一过程在个体公平性的研究中具有独立的兴趣价值。
对数凹概率测度Cramér变换矩的研究
设$\mu$为${\mathbb R}^n$上的中心对数凹概率测度,记$\Lambda_{\mu}^{\ast}$为$\mu$的Cramér变换,即$\Lambda_{\mu}^{\ast}(x)=\sup\{\langle x,\xi\rangle-\Lambda_{\mu}(\xi):\xi\in\mathbb{R}^n\}$,其中$\Lambda_{\mu}$为$\mu$的对数Laplace变换。我们证明了$\mathbb{E}_{\mu}\left[\exp\left(\frac{c_1}{n}\Lambda_{\mu}^{\ast }\right)\right]<\infty$,其中$c_1>0$为绝对常数。特别地,$\Lambda_{\mu}^{\ast}$具有所有阶有限矩。该证明基于与$\mu$相关的某些凸体族的比较,表明$\|\Lambda_{\mu}^{\ast}\|_{L^2(\mu)}\leqslant c_2n\ln n$。欧几里得球上均匀测度的例子表明,当维度$n$趋于无穷大时,该估计关于$n$是最优的。
由位错流动驱动的弹塑性演化的均匀化
从一个小应变和准静态设定下的典型弹塑性模型出发,其中塑性畸变的演化仅由离散位错的运动驱动,本文进行了一项严格的均匀化过程,得到一个涉及连续分布位错场的模型。我们的主要结果表明,存在由位错场运动驱动的速率无关演化,这些演化是从离散位错演化中获得的极限情况。对于所有解的概念,我们采用了最近的空间-时间积分和法向电流的概念,这比传统的使用Kroner位错密度张量的方法更为丰富。关键的技术挑战在于找到近似的离散位错演化来逼近给定位错场演化,这需要对空间-时间滑移轨迹及其相关位移进行精心的恢复构造。这些方法使得我们可以将离散系统中的性质(最重要的是准静态稳定性)转移到连续场系统中。
泊松点过程与Cox点过程上的分层聚类算法
聚类是一种广泛应用于无监督学习中的技术,用于基于数据集中元素之间的相似性识别组群。本文提出了三种新的分层聚类模型:Clustroid分层最近邻($\mathrm{CHN}^2$)、单链接分层最近邻($\mathrm{SHN}^2$)以及Hausdorff(完全链接)分层最近邻($\mathrm{H}^2\mathrm{N}^2$),这些模型均设计用于具有可数无限个点的数据集。这些算法通过多级聚类构建簇群,并通过连接最近邻的点或簇群实现,但它们在所采用的距离度量上有所不同(分别为clustroid、单链接或Hausdorff)。每种方法首先应用于欧几里得空间上的齐次泊松点过程,其中它定义了一种系统发育森林,该森林是点过程的一个因子,因此是单模态的。对于$\mathrm{CHN}^2$算法,建立了簇群几乎确定有限的结果,并对算法每一级的平均簇群大小给出了界限。典型簇群的平均大小被证明为无穷大。此外,当级数趋于无穷时,考察了这三种算法的极限结构,并推导出一些性质,如极限连通分量的一端性。特别地,在泊松点过程上的$\mathrm{SHN}^2$算法的极限图被证明是最小生成森林的一个子图。$\mathrm{CHN}^2$算法还被扩展到泊松设定之外,应用于某些平稳的Cox点过程。在这些情况下,类似的有限簇群性质也被证明成立。同时,还表明可以通过这种聚类算法高效检测Cox触发的聚集现象。
DataPlatter:利用低成本数据提升机器人操作泛化能力
视觉-语言-动作(VLA)模型在具身人工智能中的广泛应用加剧了对多样化操作演示数据的需求。然而,数据采集相关的高昂成本往往导致场景覆盖不足,限制了模型性能。研究发现,大型工作空间中的空间推理阶段(SRP)主导了失败案例的发生。幸运的是,这类数据可以低成本收集,凸显了利用廉价数据提升模型性能的潜力。本文提出DataPlatter方法,该框架将训练轨迹解耦为不同的任务阶段,并利用大量易于收集的SRP数据增强VLA模型的泛化能力。通过分析我们证明,针对特定子任务进行附加SRP数据的子任务特定训练,能够以适当比例作为机器人操作性能的催化剂,最大化利用昂贵的物理交互阶段(PIP)数据。实验表明,通过向有限的PIP数据集中引入大量成本效益高的SRP轨迹,我们在零样本场景中的成功率可提高41%,同时具备将操作技能迁移到新目标的能力。
VideoGLaMM:一种用于视频像素级视觉定位的大规模多模态模型
视频与文本之间的细粒度对齐因其复杂的时空动态而具有挑战性。现有的基于视频的大规模多模态模型(LMMs)能够处理基本对话,但在视频的精确像素级定位方面表现不佳。为了解决这一问题,我们提出了VideoGLaMM,这是一种针对用户提供的文本输入设计的、用于视频细粒度像素级定位的大规模多模态模型。我们的设计无缝连接了三个关键组件:大型语言模型、强调空间和时间细节的双重视觉编码器以及用于准确掩码生成的时空解码器。这种连接通过可调谐的V-L和L-V适配器实现,从而促进紧密的视觉-语言(VL)对齐。该架构经过训练,可以同步视频内容的空间和时间元素与文本指令。为了实现细粒度定位,我们利用半自动标注管道创建了一个包含详细视觉定位对话的多模态数据集,生成了包含38k个视频-QA三元组、83k个对象和671k个掩码的多样化数据集。我们在三个具有挑战性的任务中评估了VideoGLaMM:基于约束的对话生成、视觉定位和指代视频分割。实验结果表明,我们的模型在所有三项任务中均优于现有方法。
长程无挫抗铁磁伊辛链中的零温一阶和二阶量子相变
我们研究了在全相互作用范围内(从完全长程到最近邻)具有纵向场和横向场的无挫抗铁磁伊辛链基态相图。首先,我们在强长程区域解析求解该模型,并确认对于此模型平均场处理是精确的。我们计算了序参量和关联函数,表明该模型存在一个三临界点,使得相变从一阶转变为二阶。这与最近邻极限的情况形成对比,在最近邻极限中已知相变是二阶的。为了理解相变从一个极限到另一个极限如何变化,我们使用基于神经网络的变分量子蒙特卡洛方法(视觉变换器),数值处理解析不可解的相互作用范围。我们展示了随着相互作用范围减小,一阶相变如何缩小,并确定了存在一阶相变的相互作用范围的近似边界。最后,我们证明了一阶相变和三临界点的稳定关键因素是在不同亚格子间的反铁磁相互作用基础上,还存在同一亚格子内自旋之间的铁磁相互作用。可调范围的无挫抗铁磁相互作用只是实现这种交错相互作用的一种方式。
大型视觉语言模型中模态对齐的改进方法
视觉-语言模型近年来在使语言模型理解视觉输入方面取得了显著成果。然而,针对图像描述生成和视觉问答等多样化任务实现统一的模型对齐方法仍是一项挑战。现有方法要么需要非常大的语言模型,要么需要非常大的数据集,这在利用现有模型时效率不高。本文解决了这一问题,并设计了一种自回归视觉-语言模型的训练策略,以统一图像描述生成和视觉问答等视觉-语言任务。我们提出了四个训练阶段,用于对齐视觉模型与语言模型,即赋予语言模型处理视觉输入的能力。同时,我们还为基于Transformer的语言模型设计了不同的注意力掩码,以提升视觉特征的质量。此外,我们还得出了一些发现:1)注意力掩码不应应用于视觉输入;2)语言模型在AI生成的数据上收敛更快;3)在模型预训练期间应进一步优化对齐阶段的工作;4)该模型能够轻松适应下游任务,如在医疗数据集PathVQA上的视觉问答任务。经过一轮训练后,在COCO和Flickr30k数据集上的CIDEr分数等常见基准测试中,该模型的表现优于VILA-13亿参数模型,并且与GIT-2模型在相同数据集上的得分非常接近,尽管它是一个规模更小、训练数据量更少的模型。所有训练均采用最佳实践完成,如多GPU并行训练、半精度(16位浮点数)训练、快速注意力(SDPA)以及梯度累积,整个训练过程在12小时内完成。
复空间上多重次调和函数的Lelong数
本文引入了强局部不可约复空间$\widetilde{X}$的概念,并基于此概念证明了对于所有$x\in \widetilde{X}$,有$\bar{\nu}_{\varphi}(x)=$ mult$(\widetilde{X},x). \nu_{\varphi}(x)$,其中$\bar{\nu}_{\varphi}(x)$是多重次调和函数$\varphi$在点$x$处的投影质量,mult$(\widetilde{X},x)$是$\widetilde{X}$在点$x$处的重数,而$\nu_{\varphi}(x)$是$\varphi$在点$x$处的Lelong数。此外,我们还证明了在强局部不可约复空间$\widetilde{X}$上,多重次调和函数$\varphi$的上水平集$\{z\in \widetilde{X}:\nu_{\varphi}(z)\geq c\}$的闭包对于所有$c\geq 0$都是$\widetilde{X}$的一个子簇。
赫斯特-罗宾斯-埃尔德什大数定律的遗传性
我们证明了任意实值随机变量序列$f_1, f_2, \cdots$,若满足$\sup_{n \in \N} \E (f_n^2) < \infty$,则存在一个子序列$f_{k_1}, f_{k_2}, \cdots$,其在\textsc{Cesàro}均值下完全收敛于某个$\,f_\infty \in \mathbb{L}^2$,即$\sum_{N \in \N} \, \P \left( \bigg| \frac{1}{N} \sum_{n=1}^N f_{k_n} - f_\infty \bigg| > \eps \right)< \infty\,, \quad \forall ~ \eps > 0\;$;并且具有遗传性,即对于该子序列的所有进一步子序列也成立。我们还确定了一个条件,该条件稍弱于$\mathbb{L}^2$有界性,发现它不仅是上述\textsc{Cesàro}均值下遗传完全收敛性的充分条件,也是必要条件。
GenHancer:不完美的生成模型实际上是强大的视觉增强器
生成模型与判别模型之间的协同作用正受到越来越多的关注。虽然判别式的对比语言图像预训练(CLIP)在高层次语义方面表现出色,但在感知细粒度视觉细节方面存在困难。通常情况下,为了增强表征,生成模型会将CLIP的视觉特征作为重建条件。然而,其背后的原理尚未被充分探索。在这项工作中,我们实证发现,视觉上的完美生成并不总是最优的表征增强方法。关键在于从生成模型中有效提取细粒度知识,同时减少无关信息的影响。为探索关键因素,我们深入研究了三个方面:(1)条件机制:我们发现即使少量局部标记也能大幅降低重建难度,但可能导致训练崩溃。因此,我们得出结论,仅利用全局视觉标记作为条件是最有效的策略。(2)去噪配置:我们观察到端到端训练会引入额外信息。为此,我们提出了一种两阶段训练策略,优先学习有用的视觉知识。此外,我们证明轻量级去噪器可以带来显著改进。(3)生成范式:我们探索了连续和离散去噪器,并取得了理想的结果,验证了该方法的多功能性。通过我们的深入探索,最终得到了一种有效的方法,即GenHancer,在MMVP-VLM基准测试中始终优于现有技术,例如在OpenAICLIP上的提升达6.0%。增强后的CLIP还可以进一步集成到多模态大型语言模型中,以获得更好的视觉性能。所有模型和代码均已公开发布。
基于新颖采样方案的KL-测地线流匹配
非自回归语言模型能够同时生成所有标记,相较于传统自回归模型在潜在速度上有优势,但面临建模文本数据固有复杂依赖关系的挑战。本文研究了一种条件流匹配方法用于文本生成。我们将标记表示为\(V\)-维单纯形上的独热向量,并利用Kullback-Leibler (KL)散度下的测地线,这些测地线对应于logit空间中的线性插值。我们从理论上证明了最大化条件似然\(P_{\theta}(x_1 \mid x_t, t)\)可得到logit插值下的精确流匹配速度。为了解决基本推理性能不佳的问题,我们提出了一种新颖的经验采样方案,该方案迭代地从条件分布中采样并引入额外噪声,尽管缺乏完整的理论基础,但仍显著提升了结果。此外,我们提出了一个混合推理方法,结合了基本方法与采样方案。此方法在条件和非条件文本生成实验中相较离散流匹配的先前SOTA方法表现更优。
知识蒸馏与混合量化下的学习图像压缩轻量级嵌入式FPGA部署
可学习图像压缩(LIC)在率失真(RD)效率方面已显示出优于标准化视频编解码器的潜力,促使人们研究硬件友好的实现方法。大多数现有的LIC硬件实现优先考虑延迟而非RD效率,并通过广泛探索硬件设计空间来实现。我们提出了一种新的设计范式,将针对特定硬件平台调整设计的负担转向模型维度调整,同时不牺牲RD效率。首先,我们设计了一个框架,从参考教师模型蒸馏出一个更精简的学生LIC模型:通过调整单一模型超参数,我们可以满足不同硬件平台的约束,而无需复杂的硬件设计探索。其次,我们提出了GDN激活函数的一种硬件友好的实现方式,即使在参数量化后也能保持RD效率。第三,我们设计了一种流水线化的FPGA配置,通过利用并行处理和优化资源分配充分利用可用的FPGA资源。实验结果表明,我们的方法在最先进的LIC模型上表现出色,不仅超过了所有现有的FPGA实现,而且性能接近原始模型。
具有时间周期驱动的持续排除过程
我们通过数值模拟研究了一维周期晶格上具有时间周期外部势的持续排除过程。一组运行-翻转粒子在长度为$L$的晶格上运动,翻转概率为$\gamma \ll 1$,并通过硬核排斥相互作用彼此作用。外部势的影响被建模为一个特殊位点,该位点的翻转概率为$1$,我们称之为“缺陷”位点,并以速度$u$沿环形晶格移动其位置。当$\gamma=0$时,系统在没有缺陷的情况下进入堵塞状态。但引入移动缺陷会创建一种强相分离状态,其中几乎所有活动粒子都集中在单个大簇中,对于小到中等的$u$值尤为如此。这种显著效应是由活动粒子由移动缺陷诱导的长程速度关联引起的。对于较大的$u$值,单一的大簇不再稳定并分裂成多个较小的簇。对于非零$\gamma$值,翻转和缺陷运动的时间尺度之间发生竞争。虽然移动缺陷试图创建长程速度有序状态,但体相翻转倾向于随机化速度对齐。如果$\gamma$与$u/L$相当,则在移动缺陷穿越整个系统的过程中发生的翻转次数相对较少。在这种情况下,缺陷有足够的时间恢复系统的有序状态,我们的模拟表明,在此范围内$\gamma$值下,速度和密度的长程有序得以维持。随着$\gamma$进一步增加,长程有序被破坏,系统发展出高密度和低密度的多个区域。我们通过测量子系统密度涨落来表征这种情况下的密度不均匀性,并在$\gamma$-$u$平面上绘制了显示最明显密度不均匀性的热图。
使用ATLAS18内追踪器条状传感器测试件和80 MeV质子进行辐照研究
ATLAS实验计划在ATLAS内追踪器Phase-2升级中完全替换其内部探测器(ID),采用全新的全硅内追踪器(ITk)。ATLAS18硅条传感器设计运行至最大积分亮度4000 fb$^{-1}$,对应的最大通量为$1.6 \times 10^{15} \, \text{n}_{\text{eq}} / \text{cm}^2$(包括安全系数)。为了增强质量保证(QA)项目以监测传感器的关键属性,条状传感器社区正在考虑将中国散裂中子源(CSNS)作为质子辐照站点,并将高能物理研究所(IHEP)作为QA测试站点。总共18个ATLAS18 ITk QA测试样品在CSNS分别被$6.0 \times 10^{14}$、$1.6 \times 10^{15}$和$2.6 \times 10^{15} \, \text{n}_{\text{eq}} / \text{cm}^2$的质子辐照,并在IHEP进行测量,包括IV(漏电流-电压)、CV(电容-电压)以及CCE(电荷收集效率)测量。本文展示了CSNS升级后的辐照装置和IHEP的测量装置,辐照样品在IHEP、卢布尔雅那和伯明翰之间进行了交换,以交叉验证CCE测量结果。
共 13511 条搜索结果
共 13511 条