分类
面向事件相机分类与回归的高效且有效的基于点的方法再思考:EventMamba
事件相机从生物系统中汲取灵感,具有低延迟、高动态范围且功耗极低的特点。当前处理事件云的最常用方法是将其转换为帧表示,这种方法忽略了事件的稀疏性,丢失了精细的时间信息,并增加了计算负担。相比之下,点云是一种流行的三维数据处理表示方法,可以用于提取局部和全局的空间特征。然而,与基于帧的方法相比,先前的基于点的方法在处理时空事件流时表现不佳。为了弥补这一差距,我们提出了EventMamba,这是一种基于点云表示的高效且有效的方法框架,重新思考了事件云与点云之间的区别,强调了重要的时间信息。随后,事件云被馈入一个分层结构中,包含分阶段的模块,以处理隐式和显式的时间特征。具体而言,我们重新设计了全局提取器,通过时间聚合和基于状态空间模型(SSM)的Mamba增强对长事件序列的显式时间提取。实验表明,我们的模型在消耗最少计算资源的同时,在六个不同规模的动作识别数据集上仍表现出SOTA的基于点的方法性能。此外,在摄像机姿态重定位(CPR)和眼动追踪回归任务上,我们的模型甚至优于所有基于帧的方法。我们的代码可在https://github.com/rhwxmx/EventMamba获取。
针对极端热浪预测中准确度与可解释性权衡的机器学习模型层级研究
在利用机器学习(ML)进行预测时,我们主要关注性能和可解释性,这自然形成了一个权衡,即复杂模型通常具有更高的技能,但更难解释和信任。在气候科学界,可解释性尤为重要,因为我们旨在深入了解潜在现象。当预测涉及对社会影响巨大的极端天气事件时,这一点显得尤为重要。本文通过法国地区极端热浪的概率预测,使用了越来越复杂的机器学习模型层级,以找到准确度与可解释性之间的最佳平衡点。具体而言,我们使用的模型从全局高斯近似(GA)到深度卷积神经网络(CNN),中间还包括简单的内在可解释神经网络(IINN)以及使用散射变换(ScatNet)的模型。我们的研究表明,CNN虽然提供了更高的准确性,但其黑箱特性严重限制了可解释性,即使使用最先进的可解释人工智能(XAI)工具亦是如此。相比之下,ScatNet在实现与CNN相似的性能的同时,提供了更大的透明度,能够识别驱动预测的关键尺度和数据模式。这项研究强调了可解释性在气候科学中的潜力,表明较简单的模型可以媲美更复杂的模型性能,同时更容易理解。这种获得的可解释性对于建立对模型预测的信任并揭示新的科学见解至关重要,最终有助于深化我们对极端天气事件的理解和管理。
关于$\text{GL}_2$型阿贝尔簇的自同态代数及丢番图应用
设$f$和$g$为两个不同的没有复乘的新形式,且它们具有相同的系数域。本文的主要结果证明了:若素数$p$足够大时,与$f$和$g$相关的伽罗瓦表示之间存在一个同余关系,则由Eichler-Shimura构造得到的阿贝尔簇$A_f$和$A_g$的自同态代数之间存在同构。这表明了它们的构建块之间的重要关系。我们结果的一个非平凡应用是:对于所有满足$d\equiv 3 \pmod{8}$且$\mathbb{Q}(\sqrt{-d})$的类数与$3$互素的素数$d$,当$p$足够大时,方程$x^4 + dy^2 = z^p$没有非平凡本原解。我们还对方程$x^2 + dy^6 = z^p$得到了类似的结果。
高阶多重网格预处理浸入界面求解器用于具有边界和界面条件的Poisson方程
本文提出了一种多重网格预处理的高阶浸入有限差分求解器,能够精确高效地求解复杂的二维和三维域上的Poisson方程。该求解器采用低阶Shortley-Weller多重网格方法对高阶无矩阵Krylov子空间求解器进行预处理。无矩阵方法能够完全兼容高阶浸入界面法(IIM)离散化的边界和界面条件,以及高阶小波适应的多分辨率网格。通过对二维域的验证和分析表明,该算法能够为具有Dirichlet、Neumann和/或界面跃变边界条件的Laplace和Poisson问题提供高阶精度的结果,并且通过多重网格方法有效预处理。进一步研究表明,所提出的算法能够在复杂三维域上高效求解Laplace和Poisson问题的高阶离散化,并可利用数千个计算核心在多分辨率网格上实现。据我们所知,这项工作解决了迄今为止应用高阶浸入方法解决椭圆偏微分方程的最大问题规模,并首次实现了三维多分辨率自适应网格上的高阶结果。综合来看,这项研究为利用高阶浸入方法求解具有边界或界面条件的各类三维偏微分方程铺平了道路,包括线性和非线性弹性问题、不可压缩Navier-Stokes方程以及流固耦合问题。
测量和缓解非二元处理歧视的因果框架
算法决策系统的公平性研究通常将复杂的决策过程(如保释或贷款批准)简化为二分类任务。然而,这些方法忽略了此类决策本质上并非二元(例如,批准或不批准保释或贷款),还涉及影响下游结果(如贷款偿还或再犯罪)的非二元处理决策(如保释条件或贷款条款)。本文认为,非二元处理决策是决策过程的重要组成部分,并由决策者控制,因此应成为算法决策公平性分析的核心内容。我们提出了一种因果框架,该框架扩展了公平性分析,并明确区分了决策对象的协变量和处理决策。这一设定允许决策者利用我们的框架(i)在历史数据中测量处理差异及其下游影响,并通过反事实推理(ii)减轻过去不公平处理决策的影响,从而实现自动化决策。我们使用该框架对四个广泛使用的贷款审批数据集进行实证分析,揭示了非二元处理决策中的潜在差异及其对结果的歧视性影响,强调了在公平性评估中纳入处理决策的必要性。此外,通过干预处理决策,我们证明了该框架能够有效减轻历史数据中的处理歧视,确保公平的风险评分估计和(非二元)决策过程,使所有利益相关者受益。
超图中元组的多色染色问题
超图 $ H $ 由顶点集合 $ V $ 和超边集合 $ E $ 组成,其中超边是 $ V $ 的子集。超图 $ H $ 的 $ t $-元组是 $ V $ 中 $ t $ 个顶点的子集。超图 $ H $ 的 $ t $-元组 $ k $-染色是指将 $ t $-元组映射到 $ k $ 种颜色的映射。若每个至少包含 $ f $ 个顶点的超边 $ E $ 中都包含所有 $ k $ 种颜色的 $ t $-元组,则该染色称为 $(t,k,f)$-多色染色。令 $ f_H(t,k) $ 表示使得 $ H $ 存在 $(t,k,f)$-多色染色的最小 $ f $。对于超图族 $ \mathcal{H} $,令 $ f_\mathcal{H}(t,k) $ 表示所有 $ H \in \mathcal{H} $ 中的最大 $ f_H(t,k) $。我们给出了 $ t \geq 2 $ 时 $ f_\mathcal{H}(t,k) $ 的若干界值。设 $ \mathcal{H} $ 是通过取 $ \mathbb{R}^2 $ 中任意点集 $ P $ 并令 $ V:=P $ 和 $ E:=\{d \cap P \colon d \text{ 是 } \mathbb{R}^2 \text{ 中的圆盘}\} $ 所得的超图族,我们证明了 $ f_\mathcal{H}(2,k) \leq 3.7^k $,即可以对点对(2-元组)进行 $ k $-染色,使得任何包含至少 $ 3.7^k $ 个点的圆盘包含所有颜色的点对。对于 VC 维数至多为 $ d $ 的可收缩超图族 $ \mathcal{H} $,我们证明了 $ f_\mathcal{H}(d+1,k) \leq c^k $,其中 $ c=c(d) $ 是某个常数。此外,我们还证明了任意顶点数为 $ n $ 且 VC 维数至多为 $ d $ 的超图都存在一个深度至少为 $ \frac{n}{c} $ 的 $(d+1)$-元组 $ T $,即任何包含 $ T $ 的超边也包含至少 $ \frac{n}{c} $ 个其他顶点。对于超图 $ H $ 中 $ t $-元组染色与顶点染色之间的关系,我们建立了不等式 $ \frac{1}{e} \cdot tk^{\frac{1}{t}} \leq f_H(t,k) \leq f_H(1,tk^{\frac{1}{t}}) $。对于 $ k=2 $ 的特殊情况,我们证明了 $ t+1 \leq f_H(t,2) \leq \max\{f_H(1,2), t+1\} $,这改进了之前已知的最佳上界。我们将部分结果推广到了更高维度、其他形状、伪圆盘,并研究了元组染色与 $ \epsilon $-网的关系。
欧几里得快速数据发布(Q1)——深场中超冷矮星的光谱搜寻、分类与分析
欧几里得空间任务中的近红外光谱仪和光电探测器获得了数百万个天体的近红外(NIR)无狭缝光谱,其中包括数百个超冷矮星。欧几里得观测同时获取图像和光谱,这种观测模式标志着通过H2O和CH4吸收带直接识别新天体(如L型和T型矮星)新时代的到来。NISP的光谱分辨率(R~450)足以利用已知的标准模板对天体进行光谱型分类。Q1在一次访问欧几里得深场时提供了超过400万条NIR光谱。这些区域释放的大规模光谱数据使我们能够:a) 通过Zang等人(2024年)的光测候选体确认将近一半的超冷矮星;b) 直接在光谱数据库中发现至少10个新的晚期L型和T型矮星;c) 光谱确认Zerjal等人(待发表)通过新的光测选择发现的一百多个候选体。我们展示了由所有这些搜索的最佳光谱组合构建的初步欧几里得超冷矮星星表。我们还首次基于Q1数据对确认的超冷矮星进行了光谱分析,包括光谱分类、有效温度测定、H2O、CH4和NH3光谱指数以及KI吸收双线测量。本文是研究欧几里得超冷矮星的第一步,后续的数据发布将逐步完善这一研究。
内窥镜场景重建结合大尺度重建建模与高斯泼溅技术的EndoLRMGS
手术场景的完整重建对于机器人辅助手术(RAS)至关重要。深度估计方法前景广阔,但现有方法在深度不连续处表现不佳,导致物体边界处预测噪声较大,并且无法实现完整的场景重建,忽略了被遮挡的表面。为了解决这些问题,我们提出了EndoLRMGS,该方法结合了大尺度重建建模(LRM)和高斯泼溅(GS),实现了手术场景的完整重建。GS用于重建可变形组织,而LRM用于生成手术工具的3D模型,随后通过引入正交视角联合投影优化(OPjPO)进一步优化位置和尺度以提高准确性。在来自三个公开数据集的四个手术视频的实验中,我们的方法使工具3D模型在二维投影中的交并比(IoU)提高了>40%。此外,EndoLRMGS使工具投影的PSNR从3.82%提升到11.07%,组织渲染质量也得到改善,所有测试视频的PSNR从0.46%提高到49.87%,SSIM从1.53%提高到29.21%。
时间非齐次Bernoulli环境中广义激励随机游走的极限定理
我们研究了Menshikov、Popov、Ramírez和Vachkovskaia在[Ann. Probab. 40 (5), 2012]中引入的广义激励随机游走(GERW)的一个变体。该模型是在[arXiv预印本arXiv:2211.05715, 2022]中研究的模型的一个特例,其中激励的发生与否由一个时间相关的概率决定。具体来说,给定$\{p_n\}_{n \ge 1}$,其中$p_n \in (0, 1]$对所有$n \ge 1$,当过程在时间$n$首次访问某个位置时,以概率$p_n$获得固定方向上的偏移量。否则,它表现为零均值向量的$d$-鞅。我们称该模型为时间非齐次Bernoulli环境中的一类GERW,简称为$p_n$-GERW。假设跳跃有界且$p_n \approx n^{-\beta}$,我们根据$\beta$的取值以及维度$d$,展示了关于$p_n$-GERW的一系列结果。具体而言,对于每个$\beta \in (0, 1]$和$d=2$或$d>h(\beta)$(其中$h$是$\beta$的减函数),我们证明了范围的强大数定律(SLLN);而对于$\beta<1/2$,只要范围的SLLN成立,则证明了过程的次球面SLLN。我们还研究了$p_n$-GERW在扩散尺度下的行为,并得到了$\beta > 1/2$和$d\geq 2$,或者$\beta=1/2$和$d=2$时的功能中心极限定理(FCLT)。最后,对于$\beta=1/2$和$d>22$,我们证明了扩散归一化的$p_n$-GERW在分布上收敛于一个布朗运动加上时间平方根的倍数。
格点凸二次同时博弈的最佳响应算法
我们评估了格点凸二次博弈的最佳响应(BR)算法,其中玩家具有非线性目标且可行集无界。我们给出了一个充分条件:如果某些交互矩阵(定义凸二次项的正定矩阵的逆与连接一个玩家问题到另一个玩家问题的矩阵的乘积)的所有奇异值均小于1,则无论初始点为何值,迭代都不会发散。我们证明了如果迭代被限制在有限多个策略(称为陷阱)之间,则通过识别玩家策略受限于该陷阱内有限博弈的混合策略纳什均衡,可以计算出松弛版本的纳什均衡。为了验证该充分条件的严密性,我们还展示了这样的例子:即使某个交互矩阵的一个奇异值超过1,仍存在无穷多个初始点使得迭代发散。最后,我们证明了如果所有交互矩阵的所有奇异值都大于1,则迭代会从除了可能有限个初始化点之外的所有初始点发散。
光笼中的光存储:可扩展的多路复用量子存储平台
量子存储器对于光量子技术至关重要,能够实现长距离量子通信,并在量子计算中充当延迟单元。利用电磁诱导透明效应的热原子蒸气提供了一个简单的平台,具有长达一秒的光子存储能力。光波导结构可以提升性能,但当前的空心芯光纤波导在填充时间、物理尺寸、制造灵活性以及大规模集成潜力方面存在显著限制。在这项工作中,我们展示了在基于3D纳米打印空心芯波导(称为光笼,LC)的铯(Cs)量子存储器中对衰减相干光脉冲的存储,存储时间为数百纳秒。借助其灵活的制造工艺,我们在单个铯蒸气单元内成功集成了多个光笼存储器,所有设备表现出一致的性能。我们详细研究了存储效率,分析了存储寿命和带宽。这些结果标志着空间复用量子存储器向前迈出了重要一步,并有望将存储器集成提升到前所未有的水平。我们预计其将在量子中继节点的并行单光子同步以及光量子计算平台上得到应用。
强对称性下的高度纠缠稳态
我们发现强非阿贝尔守恒量的存在即使对于单位量子通道也能导致高度纠缠的稳态。我们推导了限制在一特定对称子空间(尤其是平凡子空间)中的稳态的双部分对数negativity、Rényi negativities以及算符空间纠缠的精确表达式。我们证明这些结果适用于其换位子(表征所有强守恒量)对应于李代数的通用包络代数或Read-Saleur换位子的开放量子演化。后者提供了一个量子碎片化的例子,其维度随系统大小呈指数增长。我们找到了一个普遍的上限,即链的较小部分上的换位子维度的对数。作为阿贝尔的例子,我们展示了强U(1)对称性和经典碎片化在任何对称子空间中都产生可分离的稳态。相比之下,对于非阿贝尔SU(N)对称性,logarithmic和Rényi negativities均随系统规模对数增长。最后,我们证明了当Rényi negativities的阶数n>2时,它们随系统规模对数增长,而对于Read-Saleur换位子,logarithmic negativity(以及n<2的广义Rényi negativities)则表现出体积律缩放。我们的推导依赖于在无穷大系统极限下换位子具有Hopf代数结构,因此也适用于有限群和量子群。
带压缩通信的分布式约束在线非凸优化
本文研究了网络中具有时变不等式约束的分布式在线非凸优化问题。对于时变图,我们提出了一种带压缩通信的分布式在线原对偶算法,以高效利用通信资源。我们证明所提出的算法建立了$\mathcal{O}( {{T^{\max \{ {1 - {\theta_1},{\theta_1}} \}}}} )$的网络后悔界和$\mathcal{O}( {T^{1 - {\theta_1}/2}} )$的网络累积约束违反界,其中$T$为迭代次数,${\theta_1} \in ( {0,1} )$为用户定义的权衡参数。当Slater条件成立(即在所有迭代中存在一个严格满足不等式约束的点)时,网络累积约束违反界可减少至$\mathcal{O}( {T^{1 - {\theta_1}}} )$。这些界与现有针对带有(时变)不等式约束的分布式在线凸优化问题的完美通信状态-of-the-art结果相当。最后,通过仿真示例验证了理论结果。
条件梯度方法
本文综述旨在为Frank–Wolfe算法(也称为条件梯度算法)在函数最小化中的应用提供一个简洁的入门介绍和系统的概览。这些算法在凸优化问题中特别有用,尤其是在线性优化比投影更便宜的情况下。本文材料的选择遵循了突出关键思想的原则,并介绍了我们认为可能在未来变得重要的新方法,同时对早期工作也进行了充分引用,这对发展新的方法至关重要。然而,我们的选择有时可能存在偏颇,并不一定反映研究社区的共识,我们也肯定遗漏了一些近期的重要贡献。毕竟,Frank–Wolfe研究领域非常活跃,使得该领域成为一个不断变化的目标。我们提前为任何可能的偏差深表歉意,并完全承认:我们站在巨人的肩膀上。
关于离散动力系统$\mathcal{O}_{K}$-不动点个数的计数问题及其在算术统计中的应用,II
在这篇后续论文中,我们再次研究了由$\varphi_{d, c}(z) = z^d + c$(对所有$c, z \in \mathcal{O}_{K}$)定义的多项式映射的不动点集与系数$c$之间的意外联系,其中$K$为任意次数$n > 1$的数域,且$d > 2$为整数。如同文献\cite{BK1}所述,我们的目标是研究受算术统计领域令人兴奋进展启发的计数问题,部分灵感也来源于Narkiewicz关于实数域$K$周期点的点计数结果。通过这些研究,我们证明了对于任意素数$p \geq 3$以及任意整数$\ell \geq 1$,当素理想$p\mathcal{O}_{K}$对应的主理想域$K$为任意次数$n \geq 2$的实代数数域时,映射$\varphi_{p^{\ell}, c}$的模$p\mathcal{O}_{K}$下不同的积分不动点的平均数量在$p$趋于无穷时为$3$或$0$。进一步受到Benedetto关于任意给定素数$p \geq 5$和$\ell \in \mathbb{Z}^{+}$的算术动力学中$\varphi_{(p-1)^{\ell}, c}$的$K$-有理周期点计数结果的启发,我们还无条件地证明了当$p$趋于无穷时,映射$\varphi_{(p-1)^{\ell}, c}$的模$p\mathcal{O}_{K}$下的不同积分不动点的平均数量为$1$或$2$或$0$,其中$K$为任意次数$n \geq 2$的数域(不一定为实数域)。最后,我们将算术统计中的计数与统计结果应用于推导出若干计数和统计结果;其中包括利用Lemke-Thorne最近的数域计数结果,对$\mathbb{Q}$上次数为$m := np^{\ell}$的数域$K_{f}$的数量进行上界估计,并且类似地对$\mathbb{Q}$上次数为$r := n(p-1)^{\ell}$的数域$L_{g}$的数量进行上界估计。
带有经典侧信息的电路切割
电路切割是一种通过将大型量子电路分割为较小子电路进行仿真的技术,这些子电路可以在较小的量子设备上运行。然后通过经典的后处理步骤将这些子电路的结果组合起来,以准确重构原始电路的期望值。电路切割引入了随被切割门和量子比特线路数量呈指数增长的抽样开销。许多最近开发的准概率电路切割技术利用子电路内部中间测量得到的经典侧信息来增强后处理步骤。在本文中,我们通过量子仪器的形式化一般电路切割技术来利用侧信息。借助此框架,我们分析了经典侧信息在减少电路切割抽样开销方面的优势。令人惊讶的是,我们发现某些情况下,侧信息不会降低抽样开销,而在其他情况下,它对于电路切割的可行性至关重要。此外,我们提出了一个带有侧信息的最优抽样开销下界,可以通过半定规划高效评估,并优于所有先前已知的下界。
顶夸克对产生阈值处标量过剩的观测
基于CERN大型强子对撞机(LHC)上CMS实验收集的质子-质子碰撞数据,利用√s = 13 TeV对应的138 fb⁻¹积分亮度,开展了关于包含两个带电轻子和多个喷注的末态中顶夸克对($\text{t}\bar{\text{t}}$)共振产生的搜索。分析探索了$\text{t}\bar{\text{t}}$系统的不变质量和两个角可观测量,这些可观测量直接反映了顶夸克及其反粒子自旋的相关性。与固定阶微扰量子色动力学(pQCD)预测的非共振产生相比,在动力学$\text{t}\bar{\text{t}}$阈值附近观察到显著的事件过剩。这一增强现象与非相对论量子色动力学预测的色单态赝标量($^1$S$^{[1]}_0$)准束缚托普尼奥态的产生一致。利用简化模型描述$^1$S$^{[1]}_0$托普尼奥态,测得超出pQCD预测的过剩截面为8.8$^{+1.2}_{-1.4}$ pb。
聪明地分配隐私预算:差分隐私文本重写中的智能预算分配方法
差分隐私文本重写(Differentially Private Text Rewriting)是一类文本私有化技术,其中(敏感)输入文本文档在差分隐私(DP)保证下被“重写”。此类方法背后的动机在于隐藏文本中可能包含的显式和隐式标识符,同时保留原始文本的语义含义,从而保持实用性。近年来,该领域研究产出有所增加,提供了多种基于词、句子和文档级别的差分隐私重写方法。这些方法的一个共同点是选择隐私预算(即$\varepsilon$参数),它决定了文本私有化的程度。以往工作的主要局限之一,直接源于语言本身的独特结构,即缺乏对隐私预算应分配到何处的考虑,因为并非语言的所有方面或因此文本的所有部分都具有相同的敏感性或个人属性。在这项工作中,我们首次解决了这一不足,提出了如何在一个目标文档中智能且合理地分配给定隐私预算的问题。我们构建并评估了一套基于语言学和自然语言处理(NLP)的方法,用于向文本文档中的组成标记分配隐私预算。通过一系列隐私和实用性实验,我们实证表明,在相同隐私预算下,智能分配比朴素的$\varepsilon$分布能带来更高的隐私水平和更积极的权衡。我们的工作突显了使用DP进行文本私有化的复杂性,并进一步呼吁更多研究,以找到更高效的方法,最大化DP在文本重写中提供的私有化效益。
共轭拟群的Hayashi性质
我们对共轭拟群及其连通性进行了全面描述。在此背景下,我们通过群的中心性条件重新表述了Hayashi(2013年)的猜想。这一条件本身也是一个猜想,它表明:如果有限生成的共轭类中的元素在与该类中的某个特定元素可交换时,其幂次应为中心元。我们在若干情形下证明了这一条件,例如对于有限幂零群、对称群、交错群以及二面体群。所有这些结果均转化为对应共轭拟群的Hayashi猜想。
混合特征和的平均大小
我们证明了对于适合的光滑函数 \( w \),混合特征和 \( \sum_{1\le n \le x} \chi(n) e(n\theta) w(n/x) \) 的平均大小在所有满足弱丢番图条件的无理实数 \( \theta \) 下约为 \( \sqrt{x} \),其中 \( \chi \) 来自模大素数 \( r \) 的 Dirichlet 特征族且 \( x\leq r \)。相比之下,Harper 证明了当 \( \theta \) 为有理数时,其平均大小为 \( o(\sqrt{x}) \)。本文的关键在于某些二次丢番图方程的处理。
共 13511 条搜索结果
共 13511 条