Research

arXiv

分类

在代数闭域上的分裂八元数中，我们求解了所有系数中仅常数项非纯量的多项式方程。由此，计算出八元数的n次方根。

2025-03-26更新2024-11-21 发布

变化检测是地球观测应用中的关键任务。近期，深度学习方法展示了强大的性能和广泛的应用。然而，由于精确对齐同一区域的遥感图像是一项劳动密集型工作，导致数据稀缺，从而限制了深度学习算法的性能。为了解决数据稀缺问题，我们开发了一种名为语义变化网络（SCN）的微调策略。首先，我们在单时相监督任务上预训练模型，以获取实例特征提取的先验知识。然后，该模型采用共享权重的孪生架构和扩展的时间融合模块（TFM），以保存这些先验知识，并在变化检测任务上进行微调。所学的识别所有实例的语义被调整为仅关注变化的识别。同时，我们观察到两幅图像之间的变化位置在空间上是相同的，我们将这一概念称为空间一致性。我们通过由大核卷积生成的注意力图引入这种归纳偏置，应用于两个时间点的特征。这增强了多尺度变化的建模，并有助于捕捉变化检测语义中的潜在关系。我们利用这两种策略开发了一个二元变化检测模型。该模型在六个数据集上与最先进的方法进行了验证，超越了所有基准方法，在LEVIR-CD、LEVIR-CD+、S2Looking、CDD、SYSU-CD和WHU-CD数据集上的F1分数分别为92.87%、86.43%、68.95%、97.62%、84.58%和93.20%。

计算机视觉与模式识别

2025-03-26 发布

给定两个互质数 $p<q$，Kunz-Waldi (KW) 半群包含 $p,q$ 并被包含在 $\langle p,q,r \rangle$ 中，其中 $2r=p,q,p+q$ 的偶数项之一。这些半群最初由 Kunz 和 Waldi 引入。Kunz 和 Waldi 证明了所有嵌入维数 $n\geq 4$ 的 $KW$ 半群具有 Cohen-Macaulay 类型 $n-1$，且第一 Betti 数为 ${n \choose 2}$。本文刻画了定义理想由 $2\times 2$ 矩阵的最小多项式生成的 KW 半群，并进一步确定了位于 Kunz 锥 $\mathcal{C}_p$ 同一面内部的所有 KW 半群。由此，我们给出了所有这些 KW 半群的 Betti 数的显式公式。

交换代数

13D02, 13D05 (Primary), 20M14 (Secondary)

2025-03-26更新2025-03-20 发布

本文报道了基于Au/ZnO/Pt的高次谐波体声波谐振器（HBAR）在碳化硅衬底上的制造与表征，并将其微波特性与硅基底进行对比，以适用于微机电系统应用。采用电子回旋共振磁控溅射和电子束蒸发技术制备了高度c轴取向的ZnO薄膜和金属电极。通过X射线衍射、原子力显微镜和扫描电子显微镜对生长后的层的晶体结构和表面形貌进行了表征。碳化硅衬底上的HBAR可产生多达7 GHz的多个纵向体声波谐振，其中最强的谐振出现在5.25 GHz。使用一种新颖的Q值方法测得碳化硅衬底上HBAR的f·Q（谐振频率×品质因数）参数为4.1×10¹³ Hz，据我们所知，这是所有已报告的指定ZnO基器件中最高的。

应用物理

材料科学

2025-03-26更新2023-04-09 发布

线性子空间假设（Bolukbasi等，2016）指出，在语言模型的表征空间中，关于诸如词汇数等概念的所有信息都编码在了一个线性子空间中。先前的研究依赖于辅助分类任务来识别和评估可能支持该假设的候选子空间。我们提出了一组内在标准，用于刻画理想的线性概念子空间，并使我们仅通过语言模型分布即可识别该子空间。我们的信息论框架通过调和概念信息的统计概念与概念在表征空间中如何被编码的几何概念，解决了表征空间中虚假相关特征的问题（Kumar等，2022）。作为此分析的一个副产品，我们推测了语言模型在生成过程中如何利用概念的因果过程。实证研究表明，在我们提出的框架下，对于词汇数以及餐厅评论数据集中的一些复杂方面级情感概念，线性概念擦除成功消除了大部分概念信息。我们的因果干预控制生成实验表明，至少在一个跨两种语言模型的概念中，可以通过精确操纵生成词的概念值来利用概念子空间。

计算与语言

2025-03-26更新2023-07-27 发布

生成式人工智能（GenAI）在理解世界知识并从各种模态（如文本到文本的大语言模型、文本到图像的稳定扩散以及文本到视频的Sora）中生成内容方面取得了显著进展。本文研究了GenAI在文本到模型生成方面的能力，以探究其是否能够理解嵌入AI自身参数中的高层级知识。具体而言，我们研究了一个名为“一次训练适应所有任务”的实用场景，旨在通过文本提示为不同的终端用户和任务生成个性化模型。受近期神经网络扩散的启发，我们提出了Tina，这是一种用于一次训练适应所有任务的文本条件神经网络扩散方法。Tina利用一个扩散变换模型，该模型基于使用CLIP模型嵌入的任务描述进行条件化。尽管潜在的个性化任务数量巨大（例如，$1.73\times10^{13}$），但通过我们的设计，Tina即使在小数据集（$\sim 1000$）上训练时也表现出显著的分布内和分布外泛化能力。我们进一步通过分析零样本/少样本图像提示、不同数量的个性化类别、自然语言描述提示以及预测未见实体的能力，验证了Tina对世界知识的理解。

机器学习

2025-03-26更新2024-05-23 发布

针对K-12学生的教育材料常常包含多种模态（如文本和图像），这对模型全面理解这些材料中的细微信息提出了挑战。本文提出了一种名为UniEDU的统一语言与视觉辅助系统，该系统能够服务于各种教育应用场景，包括知识推荐、知识追踪、时间成本预测以及用户答案预测等，并在一个模型中实现这些功能。与传统的任务专用模型不同，UniEDU提供了一种在多个教育任务中表现优异且具备强大泛化能力的统一解决方案。其适应性强，非常适合在多样化的学习环境中实际部署。此外，通过显著降低计算开销，UniEDU实现了约300%的效率提升，同时与经过完全微调的模型相比，性能下降极小，保持了竞争力。这项工作标志着朝着创建适应教育需求变化的多功能AI系统迈出了重要一步。

计算与语言

2025-03-26 发布

视觉-语言对比学习框架（如CLIP）能够利用自然语言监督学习表征，并提供强大的零样本分类能力。然而，由于这些方法的监督信号特性，它们缺乏学习局部特征的能力，导致在分割和检测等密集预测任务上的性能下降。相比之下，自监督学习方法能够学习细粒度表征，补充了视觉-语言训练中的高层次特征。本文提出了一种名为“和谐”的框架，结合视觉-语言训练与判别式及生成式自监督，以学习可以泛化到不同视觉下游任务的视觉特征。我们的框架特别设计用于网络抓取数据，通过不依赖负样本并采用EMA模型生成的软CLIP目标解决一对一对应问题。我们全面评估了和谐框架在各种视觉下游任务中的表现，发现其显著优于基线CLIP以及此前领先的联合自监督与弱监督方法（MaskCLIP和SLIP）。具体而言，当在CC3M数据集上预训练ViT-B时，和谐框架在ImageNet-1k的微调和零样本分类、ADE20K的语义分割以及MS-COCO的目标检测和实例分割中表现出优越性能。此外，我们还证明和谐框架在所有任务上均优于其他自监督学习方法（如iBOT和MAE）。代码公开可访问：https://github.com/MohammedSB/Harmony。

2025-03-26更新2024-05-23 发布

智能合约是在区块链上自主运行的小型程序，利用区块链作为其持久化存储。智能合约的主要平台是以太坊虚拟机（EVM）。在EVM智能合约中，一个具有重要应用价值的问题是仅通过已部署的智能合约代码来识别数据结构（在区块链状态中，即“存储”）。这个问题一直极具挑战性，常常被认为几乎无法令人满意地解决。（例如，最新的最先进的研究工具几乎无法恢复几乎所有复杂的结构，并且只能处理不到50%的合约。）主要的复杂性在于，主链上的主要数据结构（映射和数组）的位置是通过代码执行动态派生的。我们提出了精细的静态分析技术，以极高的准确性和完整性解决了链上数据结构的识别问题。我们的分析几乎普遍适用，并且能够恢复深度数据结构。与最先进的工具相比，我们的技术能够在98.6%的精度和至少92.6%的召回率下识别数据结构的具体类型，而该工具分别只有80.8%和68.2%的表现。值得注意的是，这种分析结果通常比编译器自身基于源代码生成的存储描述更加完整。

编程语言

2025-03-26 发布

量子核方法是量子机器学习中最受探索的研究方向之一。然而，量子核的结构特性和归纳偏差尚未被完全理解。在本文中，我们引入了纠缠张量核的概念——这是经典核理论中乘积核的一种推广——并证明所有的嵌入量子核都可以被理解为一个纠缠张量核。我们讨论了这种视角如何让人们获得对量子核独特归纳偏差以及其去量子化潜在方法的全新见解。

量子物理

2025-03-26 发布

我们利用甚大望远镜（VLT）/MUSE积分视场光谱仪对潮汐瓦解事件（TDE）AT2019qiz宿主星系中的扩展发射线区（EELR）进行了全面分析。高空间分辨率数据显示，在星系中心大约3.7千秒差距范围内存在一个双锥形发射结构，核区表现出显著的[OIII]发射线，而显著的[NII]发射线延伸至EELR区域。EELR的光谱分析表明，其中心区域的线比与Seyfert型电离一致，外部分布区域的线比则与LINER型电离一致，这表明电离来自星系核活动。基于光致电离和再结合平衡假设，从H$\rm{\alpha}$和H$\rm{\beta}$亮度估算得到的所有被分类为活动星系核（AGN）的spaxel所需的电离通量为$10^{41.8}$ $\mathrm{erg\,s^{-1}}$，而中心0.9千秒差距Seyfert区域的spaxel所需电离通量为$10^{40.7}$ $\mathrm{erg\,s^{-1}}$。然而，根据宁静态软X射线观测估算的核区当前bolometric亮度$L_{\text{bol}} \leq 10^{40.8}\,\mathrm{erg\,s^{-1}}$不足以电离整个EELR，暗示可能是一个最近衰减的AGN或对历史活动的延迟响应。恒星群体分析显示EELR具有后恒星爆特征，气体动力学显示与恒星动力学相比存在扰动和非圆周运动成分。值得注意的是，在AT2019qiz的X射线光变曲线中最近检测到的准周期爆发（QPE）确认了TDE-QPE关联。我们的研究结果为具有QPE探测的最近TDE宿主星系中的AGN型EELR提供了直接证据，为TDE、QPE、AGN活动和宿主星系演化之间的复杂相互作用提供了新的见解。

星系天体物理学

高能天体物理现象

2025-03-26更新2025-03-25 发布

我们提出了视觉作为LoRA（Vision as LoRA，简称VoRA），这是一种将大型语言模型（LLM）转化为多模态语言模型（MLLM）的新范式。与依赖外部视觉模块进行视觉编码的传统多模态模型架构不同，VoRA通过在LLM中集成专门针对视觉任务的LoRA层，实现了视觉能力的内化。这种设计使得在推理过程中新增的参数能够无缝融入到LLM中，消除了结构复杂性并最小化了计算开销。此外，继承了LLM处理灵活上下文的能力，VoRA可以处理任意分辨率的输入数据。为了进一步增强VoRA的视觉能力，我们引入了一种分块蒸馏方法，将预训练ViT中的视觉先验知识转移到LoRA层中，通过注入视觉知识有效加速了训练过程。此外，我们还应用了双向注意力掩码以更好地捕捉图像的上下文信息。实验结果表明，通过额外的预训练数据，VoRA的表现可与传统的基于编码器的多模态模型相媲美。所有训练数据、代码和模型权重将在https://github.com/Hon-Wong/VoRA发布。

计算机视觉与模式识别

计算与语言

2025-03-26 发布

同步现象在自然界中无处不在。尽管它对于许多系统的正常运作至关重要，但过度同步也可能有害，例如，部分同步的大脑模式支持高级认知过程和身体控制，但过度同步可能导致癫痫发作和震颤，如帕金森病等神经退行性疾病中所见。因此，一个重要的研究问题是如何开发有效的针刺控制方法，以根据需要减少或调节同步。虽然已经存在控制两两耦合振荡器的方法，但对于高阶相互作用却没有相应的方法，尽管越来越多的证据表明它们在大脑动力学中扮演着重要角色。在这项工作中，我们通过提出一种广义的控制方法填补了这一空白，该方法旨在去同步通过高阶相互作用连接的Kuramoto振荡器。我们的方法将高阶Kuramoto模型嵌入到合适的哈密顿流中，并基于哈密顿控制理论的先前工作，解析构造反馈控制机制。我们数值证明，所提出的方案能够有效防止合成和实证高阶网络中的同步。尽管我们的研究结果表明反馈回路中的两两贡献通常已足够，但在两两耦合较弱的情况下，高阶推广变得至关重要。最后，我们探讨了通过全连通超图耦合振荡器时完全去同步所需的最少控制节点数。

动力系统

优化与控制

适应和自组织系统

2025-03-26更新2024-09-20 发布

近期政策提案旨在提升通用人工智能的安全性，但对不同监管方法在人工智能安全方面的有效性缺乏理解。我们提出一个战略模型，探讨监管者、通用人工智能技术创造者以及领域专家（即那些将人工智能应用于特定领域的人员）之间的互动。我们的分析考察了针对开发链不同部分的不同监管措施如何影响开发过程的结果。具体而言，我们假设人工智能技术由两个关键属性描述：安全性与性能。首先，监管者设定适用于一个或两个参与者的最低安全标准，并对不合规行为施加严厉惩罚。然后，通用技术创造者开发技术，确定其初始安全性和性能水平。接下来，领域专家针对其特定应用场景优化人工智能，由此产生的收益通过事前协商过程在专家和通用技术创造者之间进行分配。我们对该博弈的分析揭示了两个关键见解：第一，仅针对领域专家实施的弱安全监管可能适得其反。虽然似乎合理地监管应用场景（而非通用技术），但我们的分析表明，单独针对领域专家的弱监管可能会无意中降低安全性。这一效应在广泛的设置下持续存在。第二，与上述发现形成鲜明对比的是，我们观察到更强、更恰当的监管实际上可以惠及所有受其约束的参与者。当监管者对人工智能创造者和领域专家均施加适当的安全标准时，该监管作为一种承诺机制，能够带来安全性和性能上的提升，超越无监管或仅监管单一参与者的成果。

减少容错量子计算（FTQC）的空间和时间开销一直受到越来越多的关注，因为它对于量子计算机的发展至关重要，同时也对理解实现量子优势的可能性和局限性具有根本意义。较短的时间开销对于在不牺牲运行时间优势的情况下展示量子计算加速尤为重要。然而，超越传统多项式对数（polylog）时间开销的缩放一直是一个重大挑战，因为这需要解决所有潜在瓶颈，包括实际实现中经典计算解码的非零运行时间。在这项工作中，我们构建了一种协议，实现了具有双重对数时间开销的FTQC，同时保持了传统的多项式对数空间开销。我们方法的关键在于开发了一种高度可并行化的最小权完美匹配（MWPM）解码器，该解码器在代码规模上实现了多项式对数的并行运行时间，并提供了阈值存在性和开销界限的理论保证。我们的协议结合了这种解码器与包含单次解码的拓扑编码协议；此外，我们还将其与级联Steane码相结合，以确保阈值的存在并避免积压问题，从而即使考虑到解码器的运行时间，也能实现双重对数时间开销。这些结果表明，突破传统多项式对数时间开销障碍的可行性，开辟了低开销FTQC的新前沿。

量子物理

2025-03-26更新2025-03-17 发布

J波段巨星支星（JAGB）方法是一种基于J波段富碳巨星恒星常定光度的新标准烛光方法。该方法独立于造父变星和红团簇巨星支星（TRGB）距离指示器。因此，我们可以利用它来交叉检验造父变星和TRGB距离是否存在系统误差，并用其测量独立的局部哈勃常数。JAGB方法在测量距离方面相对于TRGB和造父变星还有一些优势，而这些优势在结合JWST革命性的分辨能力时尤为突出。首先，JAGB恒星在近红外波段比TRGB亮1个星等，并且可以通过单次观测的近红外测光发现，而造父变星需要至少12个光学图像的同步观测。因此，使用相同观测时间，JAGB恒星可以用来测量比TRGB恒星和造父变星更远的距离。此外，还有其他一些优势，例如：JAGB恒星仅通过颜色和亮度即可轻易识别，近红外观测中的尘埃消光效应较小，且JAGB恒星在所有具有中间年龄恒星群体的星系中普遍存在。本文提出了一种新颖的算法，用于确定星系中应用JAGB方法的最佳位置，从而最小化拥挤效应的影响。随后，我们利用该算法对七颗Ia型超新星宿主星系的JWST近红外相机（NIRCam）成像进行分析，以测量它们的JAGB距离，并进行了完全盲测分析。这一JAGB距离标尺的零点设定在水兆赫兹旋涡星系NGC 4258中。在我们的芝加哥-卡内基哈勃计划（CCHP）综述论文Freedman等人（2025）中，我们应用本文测量的JAGB距离对卡内基超新星项目（CSP）的Ia型超新星样本进行了分析，测得哈勃常数为H₀ = 67.80 ± 2.17（统计）± 1.64（系统）km/s/Mpc。

星系天体物理学

宇宙学和非星系天体物理学

2025-03-26更新2024-08-06 发布

1847年，基尔霍夫的矩阵树定理将图的生成树数量与离散拉普拉斯算子的谱决定因子联系起来[22]。最近，对于量子图得到了一个类似的结论，将生成树的数量与在度量图函数上作用的标准（类似纽曼）顶点条件的拉普拉斯算子的谱决定因子联系起来[20]。该结果适用于边长接近的量子图。边长都相等的量子图称为正则量子图。在这里，我们考虑将单条边的长度进行扰动的正则量子图（几乎正则量子图）。我们分析了几乎正则完全图、完全二分图和循环图的谱决定因子。这提供了一种衡量谱决定因子随边长变化的速度的方法。我们将这些结果应用于估计可以观察到生成树数量与谱决定因子之间关系的边长窗口宽度。结果表明，这种关联在比[20]所要求的更宽的边长窗口内仍然成立。

数学物理

谱理论

35A01, 65L12, 65L20, 65L70

2025-03-26更新2024-06-25 发布

位于阿根廷门多萨省马兰戈附近皮埃尔·奥格天文台是现存最大的宇宙射线探测器，覆盖面积达3000平方公里。升级后的天文台在第二阶段运行中包括一个由1660个站点组成的表面阵列，结合了水切伦科夫、闪烁体和无线电探测器。部分站点还配备了地下μ子探测器。此外，四个场地上的荧光探测器俯瞰整个阵列。增强型天文台的科学目标包括通过大量统计测量超高能宇宙射线的特性，并对初级成分保持高灵敏度。天文台还能探测到最高能量下的光子和中微子，从而参与多信使研究。Auger离线框架提供了使用Geant 4工具包详细模拟天文台所有组件以及分析数据和模拟事件的工具。它被证明在其生命周期内具有足够的灵活性，能够适应新子探测器的加入，最近还调整了站内读出电子设备。一个新的挑战是将框架与机器学习工具接口，用于开发和执行基于神经网络的算法。独立于该框架，CORSIKA 7用于模拟空气簇射产生的粒子、荧光光和无线电信号。模拟生产的协调工作集中在提供标准化库以供分析，并优化计算资源的使用。我们将描述离线框架的发展和现状，以及用于协调模拟工作的工具。我们还将讨论大规模模拟工作的挑战以及为协作提供所需模拟库所消耗的资源。

高能天体物理现象

天体物理学仪器和方法

2025-03-26 发布

我们基于最新的观测结果，提出了行星状星云NGC 3132的详细三维光致电离模型。利用MOCASSIN代码，该模型结合了积分和空间分辨光谱、速度分辨的线轮廓、发射线图以及光度数据，包括来自MUSE（VLT）和JWST等的高质量最新数据。通过SOAR望远镜SAMFP仪器获得的新数据，并假设周围星云气体呈相似膨胀，得到了星云的三维密度结构。最终拟合的模型成功再现了所有可用的关键观测约束，特别是在不同离子阶段的发射线积分流量和电离结构方面。模型结果表明，前身恒星的质量为$(2.7 \pm 0.2)M_{\odot}$，并被贫氦的尘埃和气体壳层包围。由模型确定的He、C、N、O和S丰度显示星云具有C/O=$(2.02 \pm 0.28)$和N/O=$(0.39 \pm 0.38)$，与所发现的前身恒星质量一致。

太阳和恒星天体物理学

星系天体物理学

2025-03-26 发布

导出了收缩对称超bolic通道中稳态粘弹性Oldroyd-B流体流动的精确相似解。该解对于De（聚合物最长松弛时间与流体在通道中的特征驻留时间之比）的小值、聚合物黏度比η（聚合物黏度与流体总黏度之比）的所有值以及通道收缩比Λ（入口处通道高度与出口处通道高度之比）的典型值均有效。该解对于超bolic几何的意义类似于直通道中的经典Poiseuille解，在壁面上严格满足Oldroyd-B模型的精确解析解，但不满足通道超bolic部分入口处聚合物额外应力的任何初始条件。通过流函数在动量平衡中的应用，将非线性常微分方程转化为一个包含未知函数的方程，该未知函数对应于修正后的流速。利用完全谱方法并采用Galerkin型方法数值求解该方程，以计算未知函数和压力梯度。聚合物额外应力的精确解允许推导出通道内平均压降的各种表达式，其中基于流动机械能所得的表达式最为准确。其有效性范围用De、Λ和η来确定，并通过润滑方程的数值拟谱模拟予以确认。在所有情况下，预测了随着De和/或η增大时，压降相对于牛顿流体值的减小。

流体动力学

2025-03-26 发布

共 13511 条搜索结果

共 13511 条

关于分裂八元数多项式方程

SChanger：从语义变化和空间一致性视角进行变化检测

Kunz-Waldi 半群的 Betti 数

基于碳化硅衬底的ZnO高次谐波体声波谐振器在5 GHz以上的激发

因果探查的几何概念

文本到模型：用于一次训练适应所有任务的文本条件神经网络扩散

UniEDU：面向教育应用的统一语言与视觉辅助系统

和谐：一种联合自监督与弱监督学习视觉表征框架

以太坊存储变量的精确静态识别

通过纠缠张量核视角的新量子核方法

发生潮汐瓦解事件AT2019qiz及准周期爆发的后恒星爆星系中的扩展发射线区

视觉作为LoRA（Vision as LoRA）

哈密顿控制用于去同步具有高阶相互作用的Kuramoto振荡器

弱人工智能安全监管的反效果

双对数时间开销容错量子计算的多对数时间并行最小权完美匹配解码器

芝加哥-卡内基哈勃计划：JWST J波段巨星支星（JAGB）的星系际距离尺度

几乎正则量子图的谱决定因子

Pierre Auger天文台数据分析的核心软件与模拟活动

重新审视行星状星云NGC 3132：高分辨率三维光致电离模型

超bolic通道中Oldroyd-B模型润滑方程的精确解