分类
句法依存结构中的根节点是什么?
句子的句法结构可以描述为一棵树,用以表明词之间的句法关系。尽管无监督方法在提取句子句法结构方面取得了显著进展,但猜测边的正确方向仍然是一个挑战。由于句法依存结构中的边是从根节点指向其他节点的,因此猜测边的方向这一挑战可以归结为找到一棵无向树及其根节点。当前无监督方法的表现有限,这表明我们对根节点缺乏从第一性原理出发的正确认识。我们考虑了一组中心性评分,其中一些仅考虑自由树(非空间评分),另一些则考虑顶点的位置(空间评分)。我们检验了“根节点是句法依存结构中的重要或中心节点”这一假设,并确认了该假设。我们发现,通过仅考虑顶点及其邻居位置的新评分方法在猜测根节点时表现最佳。我们从网络科学的角度提供了关于根节点概念的理论和实证基础。
SceneSplat:基于高斯点 splatting 的场景理解与视觉-语言预训练
识别任意或之前未见过的类别对于全面的现实世界 3D 场景理解至关重要。目前,所有现有方法在训练过程中都依赖于 2D 或文本模态,或者在推理时结合两者。这凸显了一个明显的缺失,即没有一种模型能够单独处理 3D 数据以端到端地学习语义,并且缺乏训练此类模型所需的数据。同时,3D 高斯点 splatting (3DGS) 已成为各种视觉任务中 3D 场景表示的事实标准。然而,以通用的方式将语义推理有效整合到 3DGS 中仍然是一个开放的挑战。为了解决这些限制,我们引入了 SceneSplat,据我们所知,这是首个针对 3DGS 原生操作的大规模室内场景理解方法。此外,我们提出了一种自监督学习方案,可以利用未标注场景解锁丰富的 3D 特征学习。为了支持所提出的方案,我们推出了 SceneSplat-7K,这是首个用于室内场景的大规模 3DGS 数据集,包含来自 ScanNet、Matterport3D 等 7 个已建立数据集的 6868 个场景。生成 SceneSplat-7K 所需的计算资源相当于在 L4 GPU 上运行 119 个 GPU 天,从而实现了基于 3DGS 的室内场景推理标准化基准测试。我们在 SceneSplat-7K 上的详尽实验表明,所提出的方法相对于现有基线具有显著优势。
年轻巨型行星辐射驱动下外卫星大气的高效与低效流体动力学逃逸
中央天体的全波段辐射可能是驱动物质从行星或卫星大气逃逸的强大驱动力。当这些卫星被加热至超过其平衡温度时,由于表面重力较低,它们容易遭受显著的大气侵蚀。已知的一种机制可以达到这种高温:大气成分的辐照吸收率与再辐射吸收率的比例较大。我们研究了这一机制在次恒星温度黑体受照下的表现,并发现特定分子(如$\rm NH_3$和$\rm CH_4$)在年轻巨型行星形成后受到照射时会产生温度反转。这些非等温温度剖面导致逃逸速率显著高于在卫星平衡温度下计算得到的等温Parker模型逃逸速率。我们的结果表明,如果外卫星内部冷却不是过快的话,通过这一机制外卫星可能会失去大部分大气质量。在所有情况下,由于高层大气中的热解耦现象,我们发现不同大气组分的逃逸速率存在层次化排序。这种热解耦自然导致模型中$\rm CH_4$的耗尽和$\rm NH_3$的保留。我们发现,质量大于2倍木星质量的巨型行星在冷启动情况下,以及质量大于1倍木星质量的行星在热启动情况下,能够去除泰坦类卫星的大部分大气。因此,在假设未来的观测调查中发现并表征外卫星大气,可以限制巨型行星的形成后冷却行为。
基于柔性水气致动指环的多模态触觉纹理生成
扩展现实(XR)技术的广泛应用推动了对能够复制自然触觉并允许用户裸手自由交互的可穿戴设备的需求。然而,大多数现有的支持此类自由交互的可穿戴触觉技术只能提供有限的触觉模态。本文介绍了一种柔性触觉指环及一种数据驱动的渲染方法,用于生成多模态触觉纹理。该设备结合了气动和液压驱动,能够在近节指骨上模拟粗糙度、温度和柔软度等线索,使用户可以用指尖自然地探索周围环境。渲染方法根据用户的探索动作动态调整这些线索。我们通过一项包含十五名参与者的用户研究验证了该方法,参与者成功匹配了由指环生成的六种虚拟纹理与其真实对应物,并对其感知到的触觉进行了评价。参与者在纹理匹配任务中的准确率高达90%。形容词评价表明,该指环在所有呈现的触觉感受中提供了独特且感知丰富的刺激。这些结果突显了该指环在沉浸式XR应用中的潜力,能够提供多样化的触觉反馈而不限制物理交互。
虚二次域Hecke $L$-函数的聚集现象
我们计算了与非平凡特征相关的虚二次域Hecke $L$-函数族的聚集密度。该密度具有类似于Zubrilina关于全纯模形式聚集现象密度的普适性性质。我们证明,通过对该族函数使用具紧支集光滑权函数进行平均后得到的所有聚集函数,其渐近行为与Katz和Sarnak提出的1级密度猜想相兼容。这一族$L$-函数的聚集现象的独特之处在于其显著的准周期特性,这使得可以无需对素数进行平均即可描述这种聚集现象,并且这种特性在其他族中不存在或未被注意到。
概念树:合成数据是视觉语言模型个性化所需的一切
视觉语言模型(VLM)在多种多模态任务中表现出色。近期,提高VLM个性化能力引起了广泛关注。为了更好地将用户提供的概念融入VLM,许多方法利用正负样本对模型进行微调。然而,用户提供的正样本稀缺以及检索到的负样本质量较低给微调带来了挑战。为揭示样本与模型性能之间的关系,我们系统地研究了正负样本(易样本和难样本)及其多样性对VLM个性化任务的影响。基于详细分析,我们提出了概念树(CaT),它将概念表示为树形结构,从而能够为VLM个性化生成具有不同难度和多样性的正负样本。通过精心设计的数据过滤策略,我们的CaT框架可以确保生成数据的质量,构成一个强大的流水线。我们在多种VLM个性化基线模型上进行了全面实验,评估了该流水线的有效性,缓解了正样本不足和负样本质量低的问题。结果表明,配备所提数据过滤器的CaT显著提升了MyVLM、Yo'LLaVA和MC-LLaVA数据集上的VLM个性化能力。据我们所知,这是首个可控的VLM个性化合成数据流水线。代码已发布于$\href{https://github.com/zengkaiya/CaT}{\text{https://github.com/zengkaiya/CaT}}$。
基于无数据动作屏蔽的物理感知组合装配序列规划
组合装配利用标准化的单元基元构建满足用户规格的对象。本文研究了物理组合装配的装配序列规划(ASP)。给定目标对象的形状,目标是找到放置单元基元的一系列操作以构建目标对象。特别地,我们旨在确保计划的装配序列在物理上可执行。然而,由于组合装配的组合性质,ASP 尤其具有挑战性。为了解决这一挑战,我们采用深度强化学习来学习一种构造策略,用于按顺序放置单元基元以构建所需对象。具体而言,我们设计了一种在线的物理感知动作屏蔽,以过滤掉无效操作,这有效地指导了策略学习并确保了无违规部署。最后,我们将所提出的方法应用于超过250个3D结构的乐高积木装配任务。实验结果表明,所提出的方法能够规划出物理有效的装配序列以构建所有结构,成功率达到100%,而最佳的可比基线方法有超过40个结构失败。我们的实现代码可在 \url{https://github.com/intelligent-control-lab/PhysicsAwareCombinatorialASP} 获取。
弱*解III:收敛的前沿追踪方案
我们提出了一种修正的前沿追踪(mFT)方案,用于一维空间下的守恒律双曲系统,其中允许任意大的非线性波。通过引入并求解一个“广义黎曼问题”,我们构建了该方案,这使得在有限时间内可以得到精确解。这种方法能够精确处理所有波相邻的状态,并且除了稀疏波、接触间断和冲击波外,还能近似压缩简单波。特别是,我们需要准确表达各种波曲线,避免使用泰勒展开。在构造方案之后,在合理假设下,我们证明了mFT逼近会收敛到系统的弱*解。这基本上将大振幅数据解的存在性归结为获得逼近解总变差的均匀界。然后我们将该方案应用于气体动力学的欧拉方程,精确求解广义黎曼问题,并定义了适用于3×3和2×2系统的方案,同时证明了欧拉框架和拉格朗日框架的等价性。对于$p$-系统,即在拉格朗日框架下描述等熵气体动力学的模型,我们证明了不存在有限的相互作用时间累积。这意味着大振幅数据大解全局存在的最后一个障碍是构建一个递减的Glimm势。
Mg$^{2+}$掺杂诱导Kitaev材料Na$_{3}$Co$_{2}$SbO$_{6}$中的自旋无序态
由于主导的Kitaev交换相互作用,层状钴氧化物Na$_{3}$Co$_{2}$SbO$_{6}$被认为接近Kitaev量子自旋液体(QSL)。本文通过结构、光学、磁性和热力学测量,研究了Na$_{3}$Co$_{2}$SbO$_{6}$中由Mg$^{2+}$取代Co$^{2+}$引起的磁稀释效应和化学压力效应。未观察到结构相变,所有掺杂水平的带隙保持恒定。结合磁性和热力学测量结果发现,随着Mg掺杂量增加,反铁磁转变温度被连续抑制,在$x=0.2$时完全消失。有趣的是,当掺杂量$x$大于0.2时,既未检测到长程磁有序也未检测到自旋玻璃态,并且在零场下比热具有残余线性项。所有这些特征表明Na$_{3}$(Co$_{2-x}$Mg$_{x}$)SbO$_{6}$体系进入了一种新的自旋无序(NSD)态。
非全职惩罚与异质性退休决策
年长男性工人在不同职业中的退休行为存在差异,并对政策变化表现出不同的反应,这受到非全职工人相对于全职工人面临的非全职惩罚(即工资下降)的显著影响。许多年长者减少工作时长,在非全职惩罚较高的职业中,他们倾向于更早退休,这一点在日本和美国的数据中得到观察。本研究构建了一个包含职业选择和内生劳动供给的一般均衡模型,强调资产和养老金的存在放大了非全职惩罚对退休决策的影响。研究发现,削减员工的养老金福利会降低日本高非全职惩罚职业的整体劳动力供给,从而降低整个经济的总体福利。相反,增加所得税抵免并免除养老金的收入税可以提升所有职业的劳动力供给,并通过提高实际工资相对于保留工资的比例来增强福利。降低高惩罚职业的非全职惩罚也可以刺激这些高惩罚职业的劳动力供给,并改善长期福利。
Cat-AIR:基于内容和任务感知的全能图像修复
全能图像修复旨在利用单一模型从各种类型的退化中恢复高质量图像,且无需事先了解损坏源。然而,现有方法往往难以有效且高效地处理多种退化类型。我们提出了Cat-AIR,一种新颖的基于\textbf{内}容和\textbf{任}务感知的\textbf{全}能\textbf{图}像\textbf{修}复框架。Cat-AIR引入了交替的空间-通道注意力机制,该机制能够自适应地平衡不同任务的局部和全局信息。具体而言,我们引入了跨层通道注意力和跨特征空间注意力,这些注意力机制根据内容和任务复杂度分配计算资源。此外,我们提出了一种平滑学习策略,使模型能够在保持现有任务性能的同时无缝适应新的修复任务。大量实验表明,Cat-AIR在广泛的修复任务中实现了最先进的结果,所需浮点运算次数(FLOPs)少于先前的方法,为高效的全能图像修复建立了新的基准。
大型语言模型在零样本漏洞检测中的推理应用
在日益复杂且相互依赖的软件系统时代,自动化软件漏洞检测(SVD)仍然是一个关键挑战。尽管代码分析领域的大规模语言模型(LLMs)取得了显著进展,但现有的评估方法学往往缺乏必要的“上下文感知鲁棒性”,无法捕捉现实世界中的复杂性和跨组件交互。为了解决这些局限性,我们提出了VulnSage,这是一个全面的评估框架以及一个从C/C++开发的多样化大规模开源系统软件项目中精心策划的数据集。与现有数据集不同,它利用启发式噪声预过滤方法结合基于LLMs的推理,确保代表性和最小噪声的漏洞光谱。该框架支持函数级、文件级和函数间级别的多层次分析,并采用四种不同的零样本提示策略:Baseline、Chain-of-Thought、Think和Think & Verify。通过这项评估,我们发现结构化推理提示显著提升了LLMs的表现,其中Think & Verify将模糊响应从20.3%降低到9.1%,同时提高了准确性。我们进一步证明,专门针对代码的模型始终优于通用替代方案,其性能在不同类型的漏洞中存在显著差异,表明没有单一方法能够在所有安全上下文中普遍表现优异。数据集和代码链接:https://github.com/Erroristotle/VulnSage.git
关于具有指定顶点数和边数的连通图的最大谱半径问题
图的谱半径是指其邻接矩阵的最大特征值。设$\mathcal{C}_{n, e}$为所有具有$n$个顶点和$n-1+e$条边的连通简单图的集合。本文在$e\leq 85$或$n\geq \frac{5}{2}e$时解决了$\mathcal{C}_{n, e}$上的谱半径最大化问题。
EXPLICATE:通过可解释AI与LLM驱动的可解释性增强网络钓鱼检测
高度复杂的网络钓鱼攻击已成为主要的网络安全威胁,变得越来越普遍且难以预防。尽管机器学习技术在检测网络钓鱼攻击方面显示出潜力,但它们大多作为“黑箱”运行,无法揭示决策依据。这种缺乏透明性削弱了用户的信任并降低了其有效应对威胁的能力。我们提出了EXPLICATE:一种通过三部分架构增强网络钓鱼检测的框架,包括基于机器学习的分类器(利用领域特定特征)、结合LIME和SHAP的双重解释层(提供互补的特征级见解),以及利用DeepSeek v3增强的大语言模型(将技术解释转化为易于理解的自然语言)。实验结果显示,EXPLICATE在所有指标上的准确率达到98.4%,与现有的深度学习技术相当,但在可解释性方面更胜一筹。该框架生成的高质量解释在LLM输出与模型预测之间具有94.2%的准确性以及96.8%的一致性。我们将EXPLICATE设计为一个完全可用的图形用户界面应用程序和轻量级Chrome扩展程序,展示了其在多种部署场景中的适用性。研究表明,在安全应用中,高检测性能可以与有意义的可解释性并存。最重要的是,它弥合了自动化人工智能与用户对网络钓鱼检测系统信任之间的关键鸿沟。
细胞自动机中最小邻域与活性值之间的联系
对于群 $G$ 和有限集合 $A$,细胞自动机是通过有限邻域和局部映射定义在配置空间 $A^G$ 上的变换。尽管邻域不是唯一的,但每个细胞自动机都存在一个唯一的最小邻域,该邻域由影响局部映射行为的所有本质单元组成。细胞自动机的活跃转换是一种模式,当应用局部映射时会改变单元的当前状态。本文研究了细胞自动机的最小邻域与活跃转换数量(即活性值)之间的联系。我们的主要结果表明,活性值通常对局部映射的最小邻域大小施加若干限制。
统一观测到的动力学暗能量偏好与宇宙探针间$\Omega_m$和$H_0$的不一致性
最近基于Ia型超新星(SNe)、重子声波振荡(BAO)以及宇宙微波背景(CMB)的结果表明:1)在ΛCDM模型中,当单独分析时,$\Omega_m$和哈勃常数$H_0$的测量值可能存在不一致;2)在联合分析下,$w_0w_a$CDM模型中暗示了动力学暗能量的存在。我们研究了数据所支持的动力学暗能量宇宙学是否会在单独采用ΛCDM模型对每个探针进行分析时导致$\Omega_m$和$H_0$的偏差。我们在$w_0w_a$CDM宇宙学中生成模拟数据集,并在ΛCDM模型下拟合单个探针,发现预期的$\Omega_m$偏差约为0.03。值得注意的是,探针之间的$\Omega_m$差异与真实数据集中观察到的值一致。我们还发现,生成于$w_0w_a$CDM宇宙学中的模拟DESI-BAO数据集,在采用ΛCDM模型拟合时会导致$H_0$的偏高测量值(约1.2 km/s/Mpc),这似乎在一定程度上缓解了哈勃张力,但因真实的$H_0$值较低,实际上加剧了张力。我们发现,$\Omega_m$的差异、相对于CMB的高BAO $H_0$以及联合的动力学暗能量信号均为相关效应,可以通过新的物理或新的系统性误差同时解释。尽管有可能通过单一轴线统一近期分析中观察到的许多不一致性,但我们的结果强调了理解数据集之间系统性差异的重要性,因为它们在不同的宇宙学参数空间中有独特的影响力。
部分替代代数
本文引入了经典代数性质“替代性”的一种新颖广义概念,称为“部分替代性”。这一新概念扩展了替代代数的范围,为研究其结构性质提供了全新视角。我们证明了部分替代代数存在于任意偶数维空间中。随后,我们对满足部分替代性条件的中间$\mathbb C$-结合(非交换)代数进行了分类。我们表明,对于任意四维实部部分替代除法代数,可以选择一组基简化其乘法规则表。此外,我们证明每个四维实部部分替代除法代数自然地对应一个实李代数,从而建立了这两种重要代数框架之间的联系。我们的工作最终描述了由这类部分替代代数衍生出的所有李代数。这些结果拓展了我们对代数结构的理解,并揭示了不同类型代数之间新的联系。
合作社会中自由市场经济的特征
真正的自由市场经济的关键特征在于交易完全出于自愿。而当今市场中存在的货币创造垄断现象,使得真正的自由市场经济不再存在。当前经济体系中的中央银行制度和税收制度在自由市场经济中将不复存在。本文探讨了货币垄断如何导致当今经济体系中的不稳定性和失衡,并提出货币应源自商品和服务的自愿交换。通过考察个体自利利益一致情况下的经济互动,本文研究了所有尺度上的经济交互行为。通过对整个社会范围内商品和服务的自愿交换进行分析,发现一种能够解决现行法定货币体系诸多问题的新货币体系自然从自由市场经济中涌现出来。该新货币体系稳健且高效,并为公共产品和服务的提供及其提供者的补偿提供了途径,无需直接征税。
非线性世界中的动态因果效应:好的、坏的和丑的
应用宏观经济学家经常使用由线性模型启发的脉冲响应估计量。我们研究了当真实的数据生成过程实际上是非线性时,此类方法的估计量是否具有因果解释。我们表明,无论非线性程度如何,向量自回归和基于观测冲击或代理变量的线性局部投影都识别出因果效应的加权平均值。相比之下,利用潜在冲击的异方差性或非高斯性的识别方法对非线性偏离非常敏感。我们的分析基于通过加权回归识别边际处理效应的新结果,这些结果也可能对宏观经济学以外的研究人员感兴趣。
膨胀中的强耦合扇区:无粒子理论与无粒子
当原初密度扰动在膨胀期间耦合到无粒子的无质量、强耦合扇区(“无粒子”)时,我们计算了其关联函数。首先,通过使用Mellin-Barnes方法进行直接积分,推导出在de Sitter空间中具有所有运动学构型的共形标量的四点函数,该函数在树级交换无粒子。为了获得膨胀双谱和三谱,我们将权重移动算符应用于共形耦合标量关联函数。我们证明这些关联函数解决了由无粒子传播子所享受的额外对称性确定的微分方程。基于这些微分方程,我们能够讨论自旋无粒子交换的情况,重点关注两种可能的情况,即无粒子的电流或应力张量与膨胀子耦合,并借助自旋提升算符。最后,我们研究了由此产生的形状函数的物理现象。根据无粒子标度维度的值,我们将膨胀双谱的三种特征形状分类为近等边、近正交以及当标度维度接近半整数时出现的一种新形状。更普遍地,我们发现主导挤压极限不足以明确确定轻粒子或无粒子的探测。只有双谱和三谱的完整形状可以打破这种退化。
共 13511 条搜索结果
共 13511 条