分类

同一映射的统计双调和性

从统计流形到具有相同黎曼度量的黎曼统计流形的同一映射的张力场是泰舍列夫向量场乘以负一。我们基于同一映射的统计双调和性,推导出了一类满足半仿射条件的新统计流形。此外,当流形与黎曼度量的配对构成常曲率的单连通完备黎曼流形时,我们确定了此类流形的统计结构。

微分几何
53B12 (Primary) 53A15, 53C43, 58E20 (Secondary)
2025-03-31更新2024-11-21 发布

通过反法拉第效应在等离激元超表面中产生光驱动的斯格明子晶格

斯格明子是由缠绕矢量构型定义的拓扑结构,其表现出一个量子化的拓扑电荷。在磁性材料中,斯格明子表现为稳定的可移动自旋织构,使其成为自旋电子学研究的前沿课题。同时,它们的光学对应物为纳米尺度下操控和引导光提供了新的可能性。因此,探索磁性和光学交汇的领域对于超快控制磁过程具有巨大潜力。在此,我们报道了通过等离激元超表面中的反法拉第效应生成一种斯格明子拓扑晶格。具体而言,六边形排列的金纳米盘在每个纳米盘中诱导单向漂移光电流,而在六边形间隙中则出现反向传播的假想电流。这种相互作用形成了斯格明子磁性织构的晶格。至关重要的是,全光、大规模形成的斯格明子可能在超快时间尺度上提供了一种途径,可以将这些拓扑自旋织构整合到磁性材料中,为下一代数据存储和处理技术奠定了基础。

光学
材料科学
2025-03-31 发布

关于恒定电磁场中带电粒子的运动:平行情况

本文致力于严格推导麦克斯韦理论中的经典现象:如果初始速度平行于恒定电磁场,则带电粒子在恒定电磁场中沿直线运动。粒子由一类非线性 Klein-Gordon 方程的缩放孤子建模,并且带电粒子与电磁场之间的非线性相互作用由 Maxwell-Klein-Gordon 系统控制。我们证明,当粒子的尺寸和振幅足够小时,耦合非线性系统的解可以存在到任意给定时间,并且粒子的能量集中在线上。该方法依赖于研究孤子稳定性的调制方法以及对 Maxwell-Klein-Gordon 方程的加权能量估计。

PDE分析
2025-03-31 发布

基于样品的亚取样策略在利用量子级联激光红外成像技术检测高颗粒数微塑料中的应用

微塑料(MPs)在所有生态系统中普遍存在,影响野生动物并最终影响人类健康。自然样本的复杂性以及用于分离聚合物的处理方法的非特异性使得利用常规光谱技术对环境监测中的数千个颗粒进行表征变得不切实际。解决这一问题的主要方法是对样本的小部分进行分析或仅测量载玻片上的部分颗粒,即亚取样。本文提出了一种基于量子级联激光红外成像技术对反光Kevley载玻片和金涂层滤膜进行亚取样的策略,该技术是监测微塑料的一种有前景的工具。与大多数难以提出通用亚取样方案的先前方法不同,我们引入了基于样品的亚取样概念。这种方法可以在初步计数载玻片上的总颗粒数后,始终应用于特定样本,并突出显示最佳的亚取样区域。此阶段的误差可作为代理变量,以最小化评估颗粒和微塑料数量时的误差,显著提高大规模微塑料监测的可行性。该方法的预测能力针对纤维和碎片、总颗粒和微塑料的数量进行了测试。此外,评估结果按尺寸和聚合物类型进行了分类。在大多数情况下,参考值包含在预测值的置信区间内(通常在68%的置信区间内),相对误差低于25%。例外情况出现在当载玻片上存在非常稀少(一个或两个)特定尺寸或聚合物类型的颗粒时。该方法与其他系统性的特定策略进行了比较。

仪器与探测器
2025-03-31 发布

WinoWhat:带有常识分类的WinoGrande句子释义平行语料库

本研究深入探讨了如何利用Winograd-schema挑战来评估大型语言模型(LLMs)的常识推理能力。具体而言,我们在流行的WinoGrande基准数据集上评估了不同规模的生成式模型。我们发布了WinoWhat,这是一个新的语料库,其中WinoGrande验证集的每个实例都进行了释义。此外,我们对五个常识知识类别中的挑战性能进行了评估,提供了更精细的见解,揭示了哪些类型的知识对LLMs更具挑战性。令人惊讶的是,所有模型在WinoWhat上的表现明显更差,这表明LLMs在WinoGrande上的推理能力可能被高估。为了验证这是否是由于基准数据集的记忆效应,我们将基准实例与LLM训练数据进行匹配,并构建了两个测试套件。观察结果显示,记忆效应对WinoGrande上的模型性能影响较小。

计算与语言
人工智能
2025-03-31 发布

基于缝合模型的法国逐日降水季节性偏差订正研究:用于稳健极值表示

高分辨率且准确的逐日降水数据对于影响模型的有效运行以及正确衡量高风险事件的影响至关重要。为了生成此类数据,通常需要进行偏差订正。大多数统计方法通过采用经验或参数分布对逐日降水的概率分布进行建模。近期开发的一种基于惩罚Berk-Jones(BJ)统计检验的半参数模型,允许自动且个性化地拼接参数和非参数方法,该方法被称为Stitch-BJ模型,在正确模拟逐日降水方面表现出色,并在偏差订正场景中显示出有趣的潜力。本研究将进一步巩固这些结果,考虑逐日降水的季节特性,并在样本外情境下结合干天概率进行方法改进。我们将评估Stitch-BJ方法在这种季节性偏差订正场景中的表现,与其他经典模型如Gamma分布、指数广义Weibull(ExpW)、扩展广义Pareto(EGP)或经验分布进行对比。结果显示,Stitch-BJ分布不仅在验证集上表现优于其他所有模型,甚至包括通常因其鲁棒性而被广泛使用的经验分布。

应用
2025-03-31 发布

带入部分分支方法的Drell-Yan产生中小kt区域的次领头阶研究

部分分支(PB)方法描述了横动量相关的(TMD)部分子分布的演化,涵盖了从小到大横动量kt的所有动力学区域。小kt区域对部分子内在运动(内在kt)的贡献以及由PB TMD演化方程考虑的软胶子重求和都非常敏感。我们研究了TMD以及积分部分子分布中的软胶子发射的作用。我们详细调查了PB TMD方法在Drell-Yan(DY)产生次领头阶(NLO)下低横动量的情况。我们展示了从LHC最近跨DY质量广泛范围的DY横动量分布测量中提取非微扰“内在-kt”分布,并详细处理统计、相关和不相关不确定性。我们讨论了内在横向动量与DY质量及质心能量的关系,并与其他方法进行了比较。

高能物理-唯象学
2025-03-31更新2023-12-14 发布

XLRS-Bench:你的多模态大型语言模型能否理解极大规模超高分辨率遥感影像?

多模态大型语言模型(MLLMs)的惊人突破迫切需要新的基准来定量评估其能力、揭示其局限性并指引未来的研究方向。然而,在遥感(RS)领域,这一挑战尤为突出,因为遥感影像具有超高分辨率,包含极其复杂的语义关系。现有基准通常采用远小于真实世界遥感场景的图像尺寸,存在标注质量有限以及评价维度不足的问题。为解决这些问题,我们提出了XLRS-Bench:一个用于评估MLLMs在超高分辨率遥感场景中感知与推理能力的综合基准。XLRS-Bench拥有迄今为止观测到的最大平均图像尺寸(8500×8500),所有评估样本均经过精心的手动标注,并借助一种新颖的半自动标注器对超高分辨率遥感影像进行辅助。基于XLRS-Bench,定义了16个子任务,用于评估MLLMs的10种感知能力和6种推理能力,重点放在促进现实世界决策和捕捉时空变化的高级认知过程中。XLRS-Bench上通用和遥感专用MLLMs的结果表明,实际遥感应用仍需进一步努力。我们已开源XLRS-Bench,以支持开发更强大的遥感MLLMs的进一步研究。

计算机视觉与模式识别
2025-03-31 发布

基于单类双交叉学习(OCT-X)的早期胃癌检测集成AI系统

胃癌是全球癌症相关死亡的主要原因之一,其早期检测由于现有诊断技术的局限性而受到阻碍,导致误诊率和漏诊率较高。为解决这些挑战,我们提出了一种集成系统,该系统结合先进的硬件和软件技术以平衡速度和准确性。本研究引入了单类双交叉学习(OCT-X)算法。利用新颖的快速双阈值网格搜索策略(FDT-GS)和基于补丁的深度全卷积网络,OCT-X通过实时数据处理和无缝病变监控最大化诊断准确性。硬件组件包括一个集成了高分辨率成像传感器、实时数据处理和无线连接的一体化即时检测(POCT)设备,由NI CompactDAQ和LabVIEW软件支持。我们的集成系统实现了前所未有的99.70%诊断准确率,比现有模型提高了高达4.47%,并在多速率适应性方面提升了10%。这些结果突显了OCT-X以及集成系统的临床诊断潜力,为更准确、高效且侵入性更低的早期胃癌检测提供了途径。未来的研究将进一步探索其广泛应用,推动肿瘤学诊断的发展。代码可在https://github.com/liu37972/Multirate-Location-on-OCT-X-Learning.git获取。

图像与视频处理
计算机视觉与模式识别
人机交互
2025-03-31 发布

MultiBooth:基于文本生成图像中所有概念的方法

本文介绍了一种新颖且高效的技术MultiBooth,用于从文本生成图像中的多概念定制。尽管定制化生成方法取得了显著进展,特别是扩散模型的成功应用,但现有方法在多概念场景下往往面临概念保真度低和推理成本高的问题。MultiBooth通过将多概念生成过程分为两个阶段解决了这些问题:单概念学习阶段和多概念整合阶段。在单概念学习阶段,我们采用多模态图像编码器和高效的概念编码技术,为每个概念学习到简洁且判别性强的表示。在多概念整合阶段,我们利用边界框定义跨注意力图中每个概念的生成区域,这种方法使得在指定区域内创建独立的概念成为可能,从而促进多概念图像的形成。这一策略不仅提高了概念保真度,还降低了额外的推理成本。在定性和定量评估中,MultiBooth超越了各种基线方法,展示了其卓越的性能和计算效率。项目页面:https://multibooth.github.io/

计算机视觉与模式识别
2025-03-31更新2024-04-22 发布

全纯模形式自举的两种方法

全纯自举旨在分类理性共形场论。当特征数量变大时,直接的方法难以实施。我们将理性共形场论的所有特征组合成一个具有乘子的向量值模形式。利用向量值模形式理论中的已知结果,给定一个已知的理性共形场论,我们得到新的共享相同乘子的向量值模形式。通过取这些新解的特定线性组合,我们寻找并发现新的可接受解。在研究较多的两个特征情况下,我们重现了Wronskian指数为6和8的所有已知可接受解。该方法通过最多六个特征的例子进行了说明。因此,利用向量值模形式的方法为全纯模形式自举提供了一种新途径。

高能物理-理论
2025-03-31 发布

BRST-反场形式化中的高自旋规范模型

我们在BRST-反场形式化下研究了源自Fronsdal作用量的BRST变形的玻色高自旋规范模型的质量壳条件。假设变形参数无穷级数的收敛性,我们发现这些模型在壳上是自由的。我们进一步探讨了具有费米子的模型以及AdS空间上的模型是否也具有这种性质。结果表明,这些模型在壳上同样都是自由的。此外,我们指出这些模型的三次顶点是BRST平凡的。

高能物理-理论
2025-03-31更新2021-10-11 发布

短视频传播影响力评估:一个新的现实世界数据集与一个新的大图模型

短视频平台在全球范围内获得了极大的受欢迎程度,吸引了数百万甚至数十亿用户的兴趣。近期,研究人员强调了分析短视频传播的重要性,这通常涉及发现商业价值、公众意见以及用户行为等。本文提出了一项新的短视频传播影响力评估(SPIR)任务,并从数据集和方法两个角度推动了SPIR的发展。首先,我们提出了一个新的跨平台短视频(XS-Video)数据集,旨在为各种平台提供大规模且真实的短视频传播网络,以促进对短视频传播的研究。我们的XS-Video数据集涵盖了来自中国五大平台的117,720个视频、381,926个样本和535个主题,并标注了从0到9级的传播影响力。据我们所知,这是第一个包含跨平台数据或提供了所有观看次数、点赞数、分享数、收藏数、粉丝数、评论数及评论内容的大规模短视频数据集。其次,我们基于一种新颖的三阶段训练机制,提出了一种名为NetGPT的大图模型(LGM),以连接异构图结构化数据与大型语言模型(LLMs)的强大推理能力和知识。我们的NetGPT能够理解和分析短视频传播图,从而预测短视频的长期传播影响力。在我们的XS-Video数据集上,通过分类和回归指标进行的综合实验结果表明,我们的方法在SPIR任务中的优越性。

计算机视觉与模式识别
计算与语言
机器学习
多媒体
社会与信息网络
2025-03-31 发布

毫米波多连接下行传输中单载波、OFDM和OTFS的比较

本文在毫米波下行多连接场景下,对常见的无线通信波形——单载波(SC)、正交频分复用(OFDM)和正交时频空(OTFS)调制进行了对比研究。在这种场景中,多个接入点(APs)在时间及频率同步误差不完美的情况下共同服务于某一用户。为了进行公平比较,这三种波形均通过常见频域均衡(FDE)的变体进行评估。为此,提出了一种针对OTFS的新颖跨域迭代检测方法。从实用容量的角度数值评估了不同波形的性能。数值结果表明,由于循环前缀(CP)开销低且所提出的检测方法有效,OTFS在复杂度适度增加的情况下显著优于SC和OFDM。

信息论
信息论
2025-03-31 发布

基于LSTM网络的量子电路保真度提升:Q-fid

量子电路(QC)的保真度受硬件特性、校准状态以及编译过程等多种因素的影响,这些因素共同决定了其对噪声的敏感程度。然而,由于错误率波动以及缺乏标准化的保真度度量,现有方法难以准确估计和比较不同电路布局的噪声性能。本文提出了一种基于长短期记忆网络(LSTM)的保真度预测系统Q-fid,并设计了一种新的度量方法,用于量化量子电路的保真度。Q-fid能够直观地预测噪声中间规模量子(NISQ)电路的噪声性能,将保真度预测问题转化为时间序列预测问题,通过分析令牌化后的电路捕获门序列之间的因果依赖关系及其对整体保真度的影响。此外,该模型能够动态适应硬件特性的变化,在不同条件下提供准确的保真度预测。Q-fid的平均均方根误差(RMSE)为0.0515,比Qiskit工具mapomatic的预测精度高出24.7倍。通过提供可靠的方法进行保真度预测,Q-fid助力开发者优化编译策略,实现更高效且抗噪能力强的量子电路实现。

量子物理
人工智能
新兴技术
机器学习
2025-03-31更新2023-03-30 发布

反铁磁性和弱铁磁性

利用与La$_2$CuO$_4$及其他反铁磁钙钛矿氧化物相关的现实模型,我们研究了弱铁磁性(WF)、异常霍尔效应(AHE)和净轨道磁化(OM)之间的相互关系。它们都可以归因于Dzyaloshinskii-Moriya(DM)相互作用的形式。然而,虽然自旋弱铁磁性是由所有等效键上具有相同符号的DM矢量分量诱导的,但AHE和OM与交替符号分量有关,这些分量不会导致任何自旋倾斜。该微观模型在对称操作$\{ \mathcal{S}|{\bf t} \}$下保持不变,该操作结合了反铁磁耦合亚晶格彼此之间的位移${\bf t}$与自旋翻转$\mathcal{S}$。因此,能带结构保持Kramers简并,但时间反演对称性被破坏,为在反铁磁物质中实现AHE提供了可能性。带隙的反铁磁分裂,即破坏$\{ \mathcal{S}|{\bf t}\}$对称性的因素,在此问题中并不起主要作用。更重要的是正交应变,它负责AHE和OM的有限值。

材料科学
强关联电子体系
2025-03-31 发布

反铁磁体中磁振子限制导致的巨大自旋传输增强

自1930年Felix Bloch提出自旋波的概念以来,磁振子(自旋波的量子)在自旋电子学的一系列材料中得到了广泛研究,尤其是在非易失性存储器逻辑设备中的应用。然而,在常规反铁磁体中控制磁振子并将其应用于实际仍面临挑战。本文中,我们展示了在LaFeO$_3$/BiFeO$_3$/LaFeO$_3$全反铁磁系统中高效磁振子传输的可能性,该系统可通过电控实现,使其非常适合于能量高效的计算。利用自旋轨道驱动的自旋-电荷转换效应,我们证明了这种材料架构允许在超薄反铁磁体中实现磁振子限制,从而将磁振子传输产生的输出电压提高了几个数量级,为实现磁电存储器和逻辑功能提供了途径。此外,其非易失性特性使得超低功耗的存储器内逻辑处理成为可能,其中磁振子器件可通过磁电通道中的电控磁振子自旋流进行高效重构。

材料科学
2025-03-31 发布

跨语言触发器的文本后门攻击:CL-Attack

后门攻击通过触发大型语言模型输出特定且可控的内容,严重威胁其安全性。目前,文本后门攻击的触发器分为两类:固定词触发器和句子模式触发器。然而,前者通常容易被识别和过滤,后者如句法和风格并不适用于所有原始样本,可能导致语义偏移。本文受到实际场景中跨语言(CL)提示的启发,提出了一种更高维度的段落级触发方法,即CL-Attack。CL-Attack通过注入包含多种语言的特定结构文本实现后门注入,在分类和生成任务中实现了几乎100%的攻击成功率,并且具有较低的投毒率,相比现有后门攻击技术更具隐蔽性和通用性。在不同任务和模型架构上的大量实验表明了该方法的有效性。此外,我们还实证发现CL-Attack对当前主要防御方法更为鲁棒,相比基线后门攻击更具挑战性。为缓解CL-Attack的影响,我们进一步开发了一种新的防御方法TranslateDefense,可以在一定程度上减轻CL-Attack的影响。

密码学与安全
人工智能
2025-03-31更新2024-12-26 发布

大型语言模型结合人类专业知识用于电子健康记录中的疾病检测

目的:电子健康记录(EHR)广泛用于补充基于行政数据的疾病监测和医疗绩效评估。从EHR中定义疾病状态是一项劳动密集型任务,需要大量的人工标注疾病结果。本研究开发了一种基于先进大型语言模型的高效策略,用于从EHR临床笔记中识别多种疾病状态。方法:我们将2015年艾伯塔省加拿大心脏登记队列与EHR系统连接起来。我们开发了一个管道,利用生成式大型语言模型(LLM),通过基于特定诊断、治疗管理和临床指南的提示来分析、理解和解释EHR笔记。该管道应用于检测急性心肌梗死(AMI)、糖尿病和高血压。性能与经过临床医生验证的诊断作为参考标准以及广泛采用的基于国际疾病分类(ICD)代码的方法进行了比较。结果:研究队列包括3,088名患者和551,095份临床笔记。AMI、糖尿病和高血压的患病率分别为55.4%、27.7%和65.9%。基于LLM的管道在检测疾病方面的性能有所不同:AMI的敏感性为88%,特异性为63%,阳性预测值(PPV)为77%;糖尿病的敏感性为91%,特异性为86%,PPV为71%;高血压的敏感性为94%,特异性为32%,PPV为72%。与ICD代码相比,基于LLM的方法在所有疾病状态下均表现出更高的敏感性和阴性预测值。由LLM和参考标准检测到的病例每月百分比趋势显示出一致的模式。

计算与语言
人工智能
2025-03-31 发布

强调区分性特征用于复杂场景中的数据蒸馏

数据蒸馏在CIFAR、MNIST和TinyImageNet等简单数据集上表现出色,但在更复杂的场景中难以取得类似的结果。本文提出了一种名为EDF(强调区分性特征)的数据蒸馏方法,该方法利用Grad-CAM激活图增强合成图像中的关键区分区域。我们的方法基于一个重要观察:在简单数据集中,高激活区域通常占据大部分图像,而在复杂场景中,这些区域的大小要小得多。与以往对所有像素一视同仁的方法不同,EDF利用Grad-CAM激活图增强高激活区域。从监督的角度来看,我们弱化了损失较小的监督信号,因为它们包含的是常见模式。此外,为帮助数据蒸馏(DD)社区更好地探索复杂场景,我们构建了Complex Dataset Distillation (Comp-DD)基准,通过精心挑选ImageNet-1K的十六个子集(八个简单子集和八个困难子集)形成。特别是,EDF在复杂场景(如ImageNet-1K子集)中始终优于当前最先进的结果。希望更多研究者能受到启发并致力于提高数据蒸馏的实际可行性和有效性。我们的代码和基准将在https://github.com/NUS-HPC-AI-Lab/EDF公开。

计算机视觉与模式识别
人工智能
2025-03-31更新2024-10-22 发布

共 13511 条搜索结果

共 13511 条