分类
多重调制掺杂CdTe/(CdMg)Te量子阱中的低能激发
使用液氦温度下的远红外磁透射技术,研究了多重(十个)量子阱(QWs)中二维电子气(2DEG)的低能激发特性。相邻量子阱之间较大的间距(54纳米)排除了阱内受限电子波函数的直接相互作用。在四个具有不同间隔宽度和碘供体掺杂水平且配备金属网格耦合器的样品中,观察到了二维电子气激发的统一图景,其中包括回旋共振(CR)、其二倍频(2CR)以及磁等离子体模式(MPMs)。小振幅的MPMs源于单一量子阱中二维电子气的激发,而高振幅的MPMs则来自所有量子阱中二维电子气的相干激发。观测到了由CR、2CR和MPMs与光学声子相互作用引起的极化子效应,并通过适当的模型进行了描述。这两种类型的MPMs在接近2CR频率处的色散关系中表现出间隙,形成了伯恩斯坦模,这一现象通过适当的(非局域)理论模型进行了描述。
CFiCS:基于图的共同因素与微咨询技能分类方法
共同因素和微咨询技能对心理治疗的有效性至关重要。理解并测量这些要素能够为治疗过程及结果提供有价值的洞见。然而,由于治疗对话的微妙性和情境依赖性,从文本数据中自动识别这些变化原则仍然具有挑战性。本文介绍了一种名为CFiCS的分层分类框架,该框架结合了图机器学习与预训练上下文嵌入。我们将共同因素、干预概念和微咨询技能表示为异构图,其中ClinicalBERT提供的文本信息丰富了每个节点。这种结构捕获了层次关系(如技能层级节点链接到广泛因素)以及治疗概念的语义特性。通过利用图神经网络,CFiCS学习归纳节点嵌入,可推广到缺乏显式连接的未见过的文本样本。我们的结果显示,集成ClinicalBERT节点特征和图结构显著提高了分类性能,特别是在细粒度技能预测方面。与基线模型(包括随机森林、基于BERT的多任务模型和基于图的方法)相比,CFiCS在所有任务中均实现了显著的微观和宏观F1分数提升。
虚拟信道净化
量子错误缓解是在当前嘈杂设备以及早期容错设备上提取目标态性质的关键方法。利用标志容错和虚拟态净化的思想,我们开发了虚拟信道净化(VCP)协议,该协议消耗的量子比特和门资源与虚拟态净化类似,但在系统规模增大且噪声操作副本增多时提供更强的错误抑制能力。VCP的应用不需要关于目标量子态、目标问题或目标电路的门噪声模型的具体知识,在噪声为非相干的情况下,仍能为实际噪声环境提供严格的性能保证。进一步地,我们将VCP与量子纠错联系起来,产生了虚拟纠错(VEC)协议,这是首个结合量子纠错(QEC)和量子错误缓解的协议之一,而不仅仅是直接在逻辑量子比特上应用错误缓解协议。假设完美提取误差综合征,VEC可以在通道中几乎完全消除可纠正的噪声,同时仅付出与低阶净化相同的采样成本。当通过嘈杂通道传输未编码寄存器时,它可以在无编码寄存器上实现相当于量子纠错级别的保护,从而消除了相关编码量子比特开销。VEC的另一种变体可以通过输入位翻转码和相位翻转码模拟表面码的错误抑制能力。此外,我们的协议还可以适应量子网络中的关键任务,如信道容量激活和纠缠分布。
FLIP:迈向全面且可靠的联邦提示学习评估
随着对隐私和数据安全的日益重视,联邦学习作为一种去中心化的机器学习训练方法得到了广泛应用,无需共享原始数据。提示学习通过微调预训练模型的提示嵌入,在减少计算成本和通信开销的同时,利用视觉-语言模型(如CLIP)的强大性能和泛化能力,在联邦环境中展现出显著优势。本文探讨了联邦学习与提示学习的结合,特别是针对视觉-语言模型的应用。在本研究中,我们提出了一种名为FLIP的综合框架,用于评估联邦提示学习算法。FLIP对8种最先进的联邦提示学习方法在4种联邦学习协议和12个开源数据集上的性能进行了评估,并考虑了6种不同的评估场景。我们的研究表明,提示学习在保持分布内和分布外设置下的强泛化性能的同时,资源消耗极低。这项工作强调了联邦提示学习在数据稀缺、未见类别以及跨域分布偏移环境中的有效性。我们开源了FLIP中实现的所有算法代码,以促进该领域的进一步研究。
Be X射线双星脉冲星4U 0728-25的持续特性
我们报告了对银河系中鲜为人知的Be X射线双星脉冲星4U 0728-25于2023年4月进行的一次XMM-Newton观测结果。在未修正吸收的情况下,其观测到的X射线流量为$f_{\rm X}$(0.2-12 keV) = 1.7$\times 10^{-11}$ erg cm$^{-2}$ s$^{-1}$,这表明未被吸收的源X射线亮度$L_{\rm X} \simeq 1.3 \times 10^{35}$ erg s$^{-1}$:这是该源有记录以来的最小亮度。我们测量得到的自旋周期为$P_{\rm spin}$ = 103.301(5) s,比2016年AstroSat估算的值长约0.15%。脉冲轮廓在所有能量范围内显示出一个宽广的单峰,具有有限的能量依赖性,并且脉冲分数随能量略有增加。时间平均EPIC光谱可以用四种不同的发射模型很好地描述,其中包括单一非热成分(部分覆盖的幂律或截断幂律),或者在非热成分之外还包括热成分(黑体加幂律,或碰撞电离气体加截断幂律)。所有模型拟合效果相当好,对于幂律加黑体模型,热成分表现出高温度($kT_{\rm BB} \simeq$ 1.5 keV)和小尺寸($R_{\rm BB} \simeq$ 240 m),接近中子星极区的大小。脉冲相位存在光谱变化,表明黑体成分的流量发生变化。这些结果表明,就其亮度水平、长时间尺度上的流量变化以及光谱特性而言,4U 0728-25非常类似于大多数持久的Be X射线双星。因此,可以将其归类为此类源的一员。
最大度量下平面 Wasserstein 空间的等距刚性
我们研究了在分支空间 $\mathbb{R}^2$ 和 $[-1,1]^2$ 上装备最大范数度量的 $p$-Wasserstein 空间。我们证明对于所有 $p \geq 1$,这些空间都是等距刚性的,即这些空间的所有等距变换都由基础空间通过推前操作诱导而来。这与欧几里得度量的情形形成对比,因为在欧几里得度量下,$\mathbb{R}^2$ 的 $2$-Wasserstein 空间不是刚性的。此外,我们指出 $1$-Wasserstein 空间在闭区间 $[-1,1]$ 上不是刚性的,而根据我们的结果,其二维类比——具有更复杂测地线结构的单位闭球 $[-1,1]^2$——却是刚性的。
自由基纠错实现中自旋量子比特穿梭架构的性能研究
量子比特穿梭有望推动某些量子计算平台达到有效量子纠错(QEC)所需的量子比特寄存器规模,但也引入了额外的错误,其影响必须进行评估。在现实场景下研究QEC码性能的标准方法是采用电路级噪声这一标准噪声模型,其中所有量子操作都被建模为有噪操作。在目前的工作中,我们采用此噪声模型,并通过将穿梭错误单独作为一种额外的所谓错误位置来引入,从而分离出穿梭错误的影响。这种硬件抽象基于SpinBus架构,允许系统性的数值研究以绘制出由此产生的二维参数空间。为此,我们采用表面码并进行大规模模拟,特别是提取所述二维参数空间中的阈值。我们研究了两种穿梭错误情景:去极化和退相。对于纯退相的穿梭错误,我们发现阈值可达几个百分点,前提是其他操作具有高保真度。为了达到逻辑错误率为$10^{-12}$(即“teraquop”区域),当穿梭操作的错误率高达约1%时,所需的量子比特开销仅适度增加。实践中可预测的有效量子纠错(即远低于阈值的纠错)的错误率舒适地高于预期可实现的自旋量子比特错误率。因此,我们的结果表明,即使在令人惊讶地大的错误率下,穿梭操作也有可能低于阈值。在短期内通过实际努力,这为基于自旋量子比特的量子处理器作为可扩展容错纠错量子计算的可行途径提供了积极前景。
圆柱代数分解的几何方法
圆柱代数分解是实代数几何中的经典构造。尽管已有多种算法可以计算圆柱代数分解,但其实际性能仍然非常有限。本文从更几何的角度重新审视了该问题,将圆柱代数分解的构造与实簇之间的态射研究联系起来。结果表明,几何纤维的基数(几何属性)决定了半代数连续截面(半代数属性)的存在性。由此,在投影阶段可以系统地利用所有方程,从而得到一个新且简单的算法,其实验结果证明了其效率。
具有动力学手征费米子的QCD热力学
我们通过重叠费米子的格点模拟讨论了热量子色动力学的性质。这种费米子离散化在有限格点间距下保持手征对称性。我们详细介绍了该公式的构造并展示了手征可观测量的结果。基于条带方法在固定全局拓扑电荷下的模拟确定了拓扑易感性。利用测得的拓扑易感性,我们在所有拓扑扇区上求和手征可观测量。手征易感性的体积依赖性与热QCD相变的交叉特性一致。此外,我们讨论了重叠狄拉克算符的能谱及其体积和温度依赖性。所展示的结果是在时间维度格点大小 \(N_t=8\) 下获得的。
基于最小化过近似区域的MaxPool神经网络鲁棒性验证加强方法
神经网络分类器在安全关键领域中的鲁棒性至关重要,并可通过鲁棒性验证进行量化。目前,高效的可扩展验证技术总是正确但不完备,因此,验证鲁棒性的提升是评估不完备验证方法性能的关键标准。多变量函数MaxPool被广泛采用,但其验证具有挑战性。本文提出Ti-Lin,一种基于紧密线性逼近的MaxPool网络鲁棒性验证器。遵循最小化CNN非线性函数的过近似区域的思路,我们首次提出了对MaxPool函数而言理论上最紧密的神经元级线性边界。通过所提出的线性边界,我们可以为CNN认证更大的鲁棒性结果。我们在不同的开源基准框架下评估了Ti-Lin的有效性,包括LeNet、PointNet以及在MNIST、CIFAR-10、Tiny ImageNet和ModelNet40数据集上训练的网络。实验结果显示,Ti-Lin在所有网络上的认证准确率比最先进的方法提高了高达78.6%,而时间消耗几乎与最快工具相同。我们的代码可在https://github.com/xiaoyuanpigo/Ti-Lin-Hybrid-Lin获取。
基于变分推断和Transformer的驱动数据的季节气候预测
大多数业务气候服务提供者基于初始化的一般环流模型(GCMs)或拟合过去观测值的统计技术进行季节预测。GCMs需要大量的计算资源,这限制了它们的能力。相比之下,由于历史记录较短,统计方法往往缺乏稳健性。近期的研究提出利用气候模型输出训练的机器学习方法,利用更大的样本量和模拟场景。然而,许多这些研究关注的预测任务可能在空间范围或时间覆盖方面受到限制,与现有的业务预测存在差距。因此,本研究评估了一种结合变分推断和Transformer模型的方法来预测季节异常场的有效性。预测涵盖四季,并在每个季节开始前一个月进行初始化。该模型使用CMIP6的气候模型输出进行训练,并使用ERA5再分析数据进行测试。我们分析了该方法在预测年际异常方面的表现,这些异常超越了由气候变化引起的趋势。我们还在区域背景下测试了所提出的方案,重点关注欧洲的应用案例。尽管气候变化趋势主导了温度预测的技巧,但在受已知遥相关影响的地区,该方法相对于气候学预测表现出额外的技巧。基于降水预测的验证,我们也得出了相似的结论。尽管在大多数热带地区表现不如SEAS5,但我们的模型在许多温带内陆地区提供了附加价值。这项工作展示了在气候模型输出上训练生成模型用于季节预测的有效性,提供了在用户应用相关的时标和提前期上具有技巧性的预测,超越了由气候变化引起的趋势。
Fino1:推理增强型大语言模型在金融领域的可迁移性研究
虽然大型语言模型(LLMs)在一般推理能力方面表现出色,但它们在金融推理方面的有效性——这对于现实世界中的金融应用至关重要——仍缺乏深入探索。本研究对24个最先进的通用及推理导向型LLMs在涉及金融文本、表格数据和方程式的四项复杂金融推理任务中的表现进行了全面评估。我们评估了数值推理、表格解析、金融术语理解、长上下文理解以及基于方程的问题解决等关键能力。我们的分析表明,尽管数据质量和预训练有助于提升性能,但通用技术如思维链(CoT)微调在金融任务中带来的增益有限。为了解决这一问题,我们提出了两种领域适配模型Fino1-8B和Fino1-14B,通过思维链微调和强化学习结合领域特定的推理路径进行训练。我们的模型是在一个经过精心筛选的数据集上训练的,该数据集整合了来自多样化来源的高质量示例,涵盖财务报告、表格、方程式以及结构化的XBRL文本。尽管训练数据有限,但这些模型实现了7%-9%的性能提升,优于多个先进的LLMs,包括GPT-o1、GPT-o3-mini、GPT-4.5,并与DeepSeek模型(V3和R1)表现相当,显示出在资源受限场景中的强大实用价值。我们的研究结果强调了金融推理领域特定适应的重要性,并公开了所有数据集、模型和代码以供未来研究使用。
利用LWA对100颗脉冲星的多频率普查:基于十年观测数据的流量密度、谱线、计时、色散、偏振及其变化的系统研究(低于100 MHz)
我们利用长波阵列(LWA)展示了100颗脉冲星的普查,这是目前在低于100 MHz频率下最大的样本,包括94颗正常脉冲星和6颗毫秒脉冲星。我们检测了从26到88 MHz范围内的脉冲轮廓,其中包括新的窄带轮廓,这有助于研究轮廓演化及低频下脉冲星谱线的变化。我们报告了97颗脉冲星的平均流量密度、谱指数、曲率以及低频翻转频率测量值,其中61个源为新测量值。我们提供了所有脉冲星的多频轮廓宽度,包括27颗具有两个分量脉冲星的分量间距。我们在多个频率带中从27个源(这是这些频率下最大的样本)中检测到了偏振辐射,其中有一个新发现。我们还为五颗近期发现的脉冲星提供了新的计时解。LWA在低频下的观测特别敏感于星际介质中的传播效应。我们对脉冲星色散度(DMs)和旋转度(RMs)进行了最灵敏的测量,其对应的中位数不确定度分别为2.9×10^-4 pc cm^-3和0.01 rad m^-2,并能够追踪近十年来的变化,以及其它频率相关的效应。这使得我们可以对平均磁场施加严格的限制,未检测到超过约20 nG的变化。最后,这份普查在个别源中发现了有趣的现象,包括B2217+47中检测到频率和时间相关的DM变化,以及J0051+0423中高度圆极化辐射的检测。
多面启发式算法选择方法MFH在软件验证中的应用
当前,许多验证算法被用于提高软件系统的可靠性。选择合适的验证算法通常需要领域专业知识以及大量人力投入,因此亟需一种自动化算法选择器。然而,现有的选择器要么依赖于机器学习策略,要么依赖人工设计的启发式方法,存在对高质量带算法标签样本的依赖以及可扩展性有限等问题。本文提出了一种名为MFH的自动化算法选择方法,用于软件验证。我们的方法利用了能够产生正确结果的验证器通常实现了某些适当算法的启发式思想,并通过这些验证器支持的算法间接反映哪些算法可能适用。具体而言,MFH将语义保持转换后的程序的代码属性图(CPG)嵌入到预测模型中,以增强模型的鲁棒性。此外,该方法将选择任务分解为预测潜在适用算法和匹配最合适的验证器两个子任务。同时,MFH还引入了一个反馈循环来改进模型的预测准确性。我们在20个验证器和超过15,000个验证任务上评估了MFH。实验结果显示,即使在训练阶段没有提供真实算法标签的情况下,MFH的预测准确率达到了91.47%。并且当引入10个新验证器时,预测准确率仅下降0.84%,表明所提出的方法具有很强的可扩展性。
基于GPU加速的全同态加密框架CAT及其在高精度隐私数据集查询中的应用
我们介绍了一个开源的基于GPU加速的全同态加密(FHE)框架CAT,其功能性和效率均超越现有解决方案。CAT具有三层架构:核心数学的基础层、预计算元素和组合操作的桥梁层以及可API访问的FHE算子层。它利用并行执行操作、密文数据的明确定义布局模式、内核融合/分割以及双GPU池等技术来提升整体执行效率。此外,内存管理机制确保了服务器端的适用性并防止数据泄露。基于我们的框架,我们实现了三种广泛使用的FHE方案:CKKS、BFV和BGV。结果显示,基于Nvidia 4090的实现相比CPU实现速度提高了2173倍,对于特定操作相比最先进的GPU加速工作提升了1.25倍。此外,我们通过基于CKKS的隐私数据库查询场景验证,实现了比CPU版本快33倍的速度。所有查询任务可以在单个GPU上在一秒钟内处理多达10^3行的数据集,存储空间为2-5GB。我们的实现经过了广泛的稳定性测试,并可以轻松部署在商业GPU上。我们希望我们的工作能够通过提供一个稳健、面向工业且开源的工具,显著推动最先进的FHE算法在各种现实系统中的集成。
通过t-稳定性得到的半直交分解
在三角范畴$\mathcal{D}$中,建立了半直交分解(SOD's)与有限t-稳定性之间的关系。此外,如果$\mathcal{D}$具有Serre函子,则在较弱的假设下,建立了(1)最细的SOD's,(2)有限最细的t-稳定性,(3)有限最细的可容许滤链,以及(4)完全例外序列之间的双射对应。这些对应被证明与突变是相容的。作为副产品,得到了射影平面、各类加权射影直线以及有限无圈箭图的SOD's的分类。
视觉障碍人士更易访问的科学PDF:提升标签准确性逐步修复PDF的方法
PDF文档无障碍访问仍然是一个持续存在的挑战,阻碍了视觉障碍人士通过屏幕阅读器阅读和导航PDF文件。本文提出了一种针对初学者和有经验用户的分步过程,用于创建可访问的PDF文档,包括一种无需专业知识即可为数学公式创建替代文本的方法。在涉及十九名参与者的实验中,我们通过将原型PAVE 2.0与现有的PDF修复标准Adobe Acrobat Pro进行对比评估了我们的系统。研究结果显示,有经验用户使用PAVE 2.0后其标签得分从42.0%提高到80.1%,初学者用户从39.2%提高到75.2%。总体而言,十五名参与者表示未来会倾向于使用PAVE 2.0,所有参与者均建议将其推荐给初学者用户。我们的工作展示了PAVE 2.0在提升视觉障碍人士对PDF文档访问性方面的潜力,并指出了仍需解决的挑战。
在三种理论水平下计算的排斥原子间势
核间距远小于平衡键长时的高能排斥相互作用是决定核阻止本领和千电子伏特(keV)及兆电子伏特(MeV)辐射事件中原子散射的关键量。这种相互作用传统上在冻结原子电子密度的轨道自由密度泛函理论框架内建模,遵循齐格勒-比尔斯马克-利特马克(ZBL)模型。本文中,我们利用ZBL模型计算了特定原子对的排斥原子间势,并将其与两种量子化学计算方法进行比较——即基于灵活高斯基组的第二阶莫耳-普莱舍特微扰理论以及采用数值原子轨道基组的密度泛函理论——这些方法超越了ZBL模型的局限性,允许在计算中放松密度。我们表明,这两种量子化学模型预测的排斥原子间势对于超过30电子伏特的势能值一致在约±1%以内,而ZBL特定原子对势和通用ZBL势则与这些计算结果存在较大差异。我们为所有原子对$Z_1$-$Z_2$($1 \leq Z_i \leq 92$)提供了新的基于三个指数的屏蔽函数拟合,与计算结果一致在约±2%以内。我们利用新的势能模拟了单晶硅中的离子注入深度分布,并显示出与实验的良好一致性。然而,我们也展示了在通道效应条件下,势能的吸引部分可以影响深度分布。所有计算得到的原子间势的完整数据集及其数据分析拟合均作为开放获取资源共享。
基于多模态知识蒸馏的人类轨迹预测
行人轨迹预测在自动驾驶和移动机器人导航等多种应用中至关重要。在这些应用中,基于相机的感知可以提取额外的模态(人体姿态、文本)以提高预测准确性。实际上,我们发现文本描述在整合额外模态到统一理解中起到了至关重要的作用。然而,在资源受限系统中,实时提取文本需要使用视觉语言模型(VLM),这可能不可行。为了解决这一挑战,我们提出了一种多模态知识蒸馏框架:通过有限模态的学生模型从经过全模态训练的教师模型中进行蒸馏。利用轨迹、人体姿态和文本综合知识的教师模型,通过仅使用轨迹或人体姿态作为补充,将其知识蒸馏到学生模型中。通过这种方式,我们将代理内部多模态的核心移动洞察力以及代理间交互分别进行蒸馏。我们的通用框架在三个数据集(基于自我视角的JRDB、SIT和基于鸟瞰图视角的ETH/UCY)上的两种设置中,使用标注文本和VLM生成的文本字幕进行了验证,涉及两种最先进的模型。蒸馏后的学生模型在完整和瞬时观测的所有预测指标上均显示出一致的改进,提升幅度高达约13%。代码可在https://github.com/Jaewoo97/KDTF获取。
基于高光谱视频的目标跟踪高光谱适配器
基于高光谱视频的目标跟踪吸引了越来越多的关注,因为高光谱视频包含了丰富的材质和运动信息。目前主流的高光谱方法通过在高光谱数据集上微调整个预训练的基于RGB的目标跟踪网络来适应高光谱任务,在具有挑战性的场景中取得了令人印象深刻的结果。然而,高光谱跟踪器的性能受到在转换过程中光谱信息丢失的限制,并且对整个预训练网络进行微调在实际应用中效率低下。为了解决这些问题,本文提出了一种新的高光谱目标跟踪方法——高光谱跟踪适配器(HyA-T)。提出了自注意力的高光谱适配器(HAS)和多层感知器的高光谱适配器(HAM),通过将适配信息增强到多头自注意力(MSA)模块和多层感知器(MLP)的计算中,从而生成适配信息并转移预训练网络中的MSA和MLP用于高光谱目标跟踪任务。此外,还提出了输入的高光谱增强(HEI),将原始光谱信息增强到跟踪网络的输入中。所提出的方法直接从高光谱图像中提取光谱信息,防止了光谱信息的丢失。此外,仅微调所提出方法中的参数,这比现有方法更高效。在四个具有不同光谱波段的数据集上进行了广泛的实验,验证了所提出方法的有效性。HyA-T在所有数据集上达到了最先进的性能。
共 13511 条搜索结果
共 13511 条