分类
具有冲突的并行机调度的紧凑公式及有效不等式
在并行机上调度具有冲突的工作问题涉及将一组工作分配到一组机器上,使得没有两个冲突的工作被分配到同一台机器上,并且所有机器中的最大处理时间最小化。我们基于顶点着色问题的代表模型提出了一种新的紧凑混合整数线性公式,克服了自然指派模型固有的许多问题。我们研究了相关多面体的多面体特性,并描述了从稳定集多面体继承的有效不等式类。我们描述了该问题的分支切割算法,并报告了基准实例上的计算实验结果。在基准集合中最难实例上的计算结果显示,所提出的算法优于当前最先进的方法(无论是运行时间还是解的质量)。我们发现,当最优值与平凡下界(即所有处理时间之和除以机器数量)之间的差距增大时,我们的新方法比现有方法表现得更好。
基于深度强化学习的非线性实时运动cueing算法
在运动模拟中,运动cueing算法用于规划运动模拟平台的轨迹,但由于工作空间限制,无法直接再现参考轨迹。在这种情况下,诸如motion washout(返回平台中心)等策略至关重要。对于具有高度非线性工作空间的串联系统运动模拟平台(MSPs),最大化利用MSPs的运动学和动力学能力尤为重要。传统的经典washout滤波和线性模型预测控制方法未能考虑平台特定的非线性特性,而非线性模型预测控制尽管全面但计算需求高,难以在不简化的情况下实现飞行员在环的实时应用。为克服这些局限性,我们提出了一种基于深度强化学习的新方法,并首次在6自由度设置中展示了其对MSPs运动学非线性的全面考虑。作者先前的工作成功展示了深度强化学习(DRL)在简化2自由度设置中的应用,该设置未考虑运动学或动力学约束。通过将完整的MSPs运动学模型纳入算法中,该方法已扩展到所有6个自由度,这是实现实际运动模拟器应用的关键一步。DRL-MCA的训练基于演员-评论家实现的近端策略优化,并结合自动超参数优化。在详细描述必要的训练框架和算法本身后,我们进行了全面验证,表明DRL MCA在性能上可与现有算法竞争。此外,它通过遵守所有系统约束生成可行轨迹,并满足低延迟下的所有实时要求...
非中心对称α-Mn晶格Re基中熵/高熵合金中的超导性
具有非中心对称(NC)结构的中熵合金(MEA)或高熵合金(HEA)以及Re基化合物为探索非常规超导性提供了肥沃的研究土壤。本文成功合成了五种之前未报道的具有α-Mn晶格的NC Re基MEA-HEA超导体,其超导转变温度(Tcs)范围在4到5 K之间。通过成分调整调控价电子数(VEC),可以提高超导转变温度(Tc)。磁化测量结果表明,所有合成的Re基MEA-HEA均为体心II型超导体。比热分析显示这些HEA的超导态可以用单一s波模型很好地描述。研究发现,这些α-Mn MEA/HEA超导体的Kadowaki-Woods比率接近重费米子化合物的典型值,表明存在强电子关联。这些发现为研究非中心对称MEA-HEA中超导性起源中的高无序性提供了有前景的材料平台。
基于相干性的波粒二象性无测量依赖描述
波粒二象性作为玻尔互补性的重要概念之一,在量子力学领域具有重要意义。定量分析波粒二象性旨在建立粒子性和波动性之间的互补关系。超越传统基于特定量子信息测度的定量分析方法,我们致力于通过相干性提供一种无测量依赖的互补关系。利用固定对角元集合中的最大相干态,提出了一种无测量依赖的互补关系。在此基础上,我们给出了d路径干涉仪中波-粒-混杂三重性的一种无测量依赖的描述。我们的互补关系揭示了波粒二象性与量子相干性之间的关系,并进一步证明了相干性真正体现了量子系统的波动本质。
相干退相干引起的三体量子系统纠缠分布
在量子信息处理中,如何在退相干过程中保持多体纠缠是一项关键挑战。然而,在混合态下评估多体纠缠受到退相干的影响是一项艰巨的任务。利用环境记忆可以减轻影响多体纠缠的退相干动力学,从而减缓其退化速度。用于量化纠缠的重要度量之一是纠缠相对熵。尽管该度量不是单配性的,但它可以普遍应用于纯态和混合态。基于这一基本创新,本文引入了一个量化器,以研究当多体态暴露于多体退相位设置时,纠缠如何在多体态的量子比特之间保持分布。我们的研究使用了各种处于有限温度下的纯态和混合三体态,并考虑了Markovian和非Markovian局域/共同浴的情况。我们还考虑了三个量子比特分别与局部浴相互作用以及与共同浴相互作用的情形。结果显示,量子系统的退相干鲁棒性取决于纠缠的分布及其与不同浴配置的相互作用。当每个量子比特拥有自己的局部环境时,系统的分布动力学会与所有三个量子比特共享一个共同环境时有所不同,但混合态情况例外。
一种用于单元稳健协方差估计的平滑多组高斯混合模型
由专家意见或医学诊断预先定义的数据组是否对应于基于统计建模的组?为什么观测值可能不一致?本文通过提出一种新颖的多组高斯混合模型来回答这两个问题,该模型在考虑给定组上下文的同时允许高度灵活性。这是通过对特定组的观测值不是来自单一分布而是来自所有组分布的高斯混合分布假设实现的。此外,该模型对单元异常值具有鲁棒性,即对观测值的异常数据单元具有鲁棒性。目标函数可以表述为一个似然问题并高效优化。我们还推导了估计量的理论破裂点,在此背景下这是一个创新的结果,用于量化对单元异常值的鲁棒程度。模拟结果表明其优异性能以及相对于替代模型和估计器的优势。来自不同领域的应用展示了该方法的力量,特别是在研究位于不同组重叠区域的观测值时。
MAD:基于跨域扩散模型的一体化化妆技术
现有的化妆技术往往需要设计多个模型来处理不同的输入,并在不同领域之间对齐特征以完成不同的化妆任务(例如,美颜滤镜、妆容迁移和卸妆),这导致了复杂性的增加。另一个局限性在于缺乏文本引导的虚拟试妆功能,这种方式更友好,无需参考图像即可实现。在本研究中,我们首次尝试使用单一模型完成多种化妆任务。具体来说,我们将不同的化妆任务表述为跨域转换,并利用跨域扩散模型完成所有任务。与现有依赖单独编码器-解码器配置或基于循环机制的方法不同,我们提出使用不同的领域嵌入来促进领域控制。这种方法仅需通过更改嵌入即可实现无缝的领域切换,从而减少了对不同任务附加模块的依赖。此外,为了支持精确的文本到化妆应用,我们通过扩展MT数据集并添加文本注释,引入了MT-Text数据集,推动了化妆技术的实用性。
基于掩码选择状态空间建模的音视频可控视频扩散网络用于自然Talking Head生成
Talking Head合成对于虚拟化身和人机交互至关重要。然而,大多数现有方法通常局限于接受单一主要模态的控制,限制了其实际应用价值。为了解决这一问题,我们提出了\textbf{ACTalker},一种端到端的视频扩散框架,支持Talking Head视频生成的多信号控制和单信号控制。对于多信号控制,我们设计了一个具有多个分支的并行mamba结构,每个分支利用单独的驱动信号控制特定的面部区域。在所有分支之间应用门机制,提供对视频生成的灵活控制。为了确保受控视频在时间和空间上的自然协调,我们采用了mamba结构,使驱动信号能够在每个分支的两个维度上操作特征标记。此外,我们引入了一种掩码丢弃策略,允许每个驱动信号在其对应的面部区域内独立控制mamba结构中的相应部分,避免控制冲突。实验结果表明,我们的方法可以生成由多样化信号驱动的自然面部视频,并且mamba层能够无缝整合多种驱动模态而不会产生冲突。
恢复《原本》第十卷为原始Theaetetean形式的研究
本文旨在以两种独立的方式将《原本》第十卷恢复为其原始的Theaetetean形式,即在Eudoxean之前的版本。首先,我们通过将第十卷与柏拉图对Theaetetus数学发现的描述以及他为哲学模仿这些发现的内容进行关联,从而恢复第十卷丰富的数学内容。由此,Theaetetus证明了:(i)满足$Ma^2 = Nb^2$且MN非平方数的线段a与b的anthyphairesis最终具有周期性;(ii)满足更一般的二次表达式的线段a与b的anthyphairesis最终具有周期性,并利用这一结果表明尽管12类alogoi线段,包括minor线段,彼此之间为alogoi关系,但它们可以通过最终具有周期性的“面积应用”在缺陷中的方式确定;(iii)对于任何非平方数N,$\sqrt{N}$的无理数anthyphairesis具有回文周期性,这与一般Pell的Diophantine问题相关。其次,我们恢复了第十卷所有命题的证明,这些证明基于Theaetetus的方法,而非Eudoxus关于量的比例理论,特别是不使用《原本》第五卷定义4中的Eudoxus条件。这种恢复基于我们对Theaetetus关于比例理论的重建,该理论适用于一类有限的比率a/b,其中a和b要么是可公度的,要么其anthyphairesis最终是周期性的,而不使用Eudoxus条件。其成功进一步验证了我们的重建工作。本文的最终版本将作为章节发表于《Ganita Bh\=arat\=i, 印度数学史学会公报》(2)45卷(2023年)。
感知运动视觉Transformer
本文提出了一种名为感知运动Transformer(SMT)的视觉模型,该模型受到人类扫视眼动的启发,通过优先处理视觉输入中的高显著性区域,提升了计算效率并减少了内存消耗。与传统对所有图像块均匀处理的模型不同,SMT基于内在二维(i2D)特征(如角点和遮挡)识别并选择最具显著性的图像块,这些特征富含信息且与人类注视模式相一致。SMT架构利用这一生物学原理,借助视觉Transformer仅处理最具有信息量的图像块,从而大幅降低了与所选图像块序列长度相关的内存使用。这种方法与视觉神经科学的研究结果一致,表明人类视觉系统通过选择性和空间动态聚焦优化了信息采集过程。在Imagenet-1k数据集上的实验评估显示,SMT在显著减少内存消耗和计算复杂度的同时,仍能实现竞争性的top-1准确率,尤其是在使用有限数量图像块时尤为明显。这项工作将类似扫视的选择机制引入基于Transformer的视觉模型中,为图像分析提供了高效替代方案,并为资源受限应用提供了新的生物启发式架构思路。
探测与横向本征速度对齐的宇宙偶极子
我们展示了首次观测到的一种新的偶极子特征,该特征由横向速度印刻在CMB(宇宙微波背景)上的情况。宇宙本征速度指向引力势阱并远离势垒,反映出大尺度引力势的偶极分布,这一分布在整个数百兆帕秒范围内具有连贯性。我们预测了所有与势场相关的字段中存在大尺度偶极子,并且可以通过引力透镜效应以及积分 Sachs-Wolfe (ISW) 效应进行观测。ISW 偶极子与小尺度移动透镜效应不同,后者具有相反符号的偶极子。我们提供了一个统一的框架来分析这些偶极子,并首次在星系密度、CMB 透镜收敛和 ISW 效应中检测到它们。我们表明观测到的信号与LCDM预测一致,并对修改后的引力设定了限制。CMB 偶极子信号独立于星系偏差,并且与单极子相关函数正交,因此这个新观测提供了额外的宇宙学信息(摘要)。
具有归一化正分母的有理函数逼近
有理函数逼近是一种简单但灵活的替代多项式逼近的方法,能够在不产生振荡伪影的情况下捕捉复杂的非线性特性。然而,由于可能产生虚假奇点,针对噪声数据使用有理函数的尝试很少。为了避免奇点的出现,我们利用Bernstein多项式及其系数的适当条件,强制分母严格为正。虽然这减少了可表达的有理多项式的范围,但它保留了有理函数的所有优点,同时在噪声数据场景中保持了多项式逼近的稳健性。我们的数值实验表明,现有的有理逼近方法在逼近域内持续产生虚假极点,而我们的方法不会在逼近域内产生极点,并且对具有多个变量的函数提供的拟合效果优于多项式逼近甚至惩罚样条。此外,在使用谱方法数值求解微分方程时,保证区间内无极点对于估计非恒定系数至关重要,这可以紧凑地表示原始微分方程,使数值求解器能够快速达到高精度,正如我们的实验所示。
数据驱动的目标跟踪:将模块化神经网络集成到卡尔曼框架中
本文提出了针对多目标跟踪(MOT)的新颖机器学习(ML)方法,特别设计以满足高级驾驶辅助系统(ADAS)日益复杂和精确的需求。我们引入了三种神经网络(NN)模型,以解决MOT中的关键挑战:(i)用于轨迹预测的单预测网络(SPENT),(ii)用于将个体传感器目标(SO)映射到现有轨迹的单关联网络(SANT),以及(iii)用于将多个SO关联到多个轨迹的多关联网络(MANTa)。这些模型被无缝集成到传统的卡尔曼滤波器(KF)框架中,通过替换相关组件保持系统的模块化特性,而不影响整体架构。重要的是,所有三个网络均设计为在实时嵌入式环境中运行。每个网络包含少于50k个可训练参数。我们在公开的KITTI跟踪数据集上的评估表明,跟踪性能显著提升。SPENT相比标准KF将均方根误差(RMSE)降低了50%,而SANT和MANTa在传感器目标到轨迹的分配任务中达到了高达95%的准确性。这些结果强调了将任务特定的NN集成到传统跟踪系统中的有效性,提升了性能和鲁棒性,同时保持了模块化、可维护性和可解释性。
不同文档类别中PDF解析工具的比较研究
PDF是最为广泛使用的数据格式之一,因此PDF解析对于信息抽取和检索尤为重要,尤其是在基于检索增强生成(RAG)系统兴起的背景下。尽管存在多种PDF解析工具,但它们在不同文档类型上的有效性仍缺乏深入研究,特别是在非学术论文领域。本研究通过使用DocLayNet数据集,对10种流行的PDF解析工具在6类文档中的表现进行了对比分析。这些工具包括PyPDF、pdfminer-six、PyMuPDF、pdfplumber、pypdfium2、Unstructured、Tabula、Camelot,以及基于深度学习的工具Nougat和Table Transformer (TATR)。我们评估了文本提取和表格检测能力。在文本提取方面,PyMuPDF和pypdfium总体表现优于其他工具,但在科学和技术专利文档中,所有解析器均表现不佳;针对这些具有挑战性的类别,基于学习的工具如Nougat展现了更优的性能。在表格检测方面,TATR在金融、专利、法律与法规、科学等领域表现出色;表格检测工具Camelot在标书文档中表现最佳,而PyMuPDF在操作手册类别中表现优异。我们的研究结果强调了根据文档类型和具体任务选择合适解析工具的重要性,为研究人员和实践者处理多样化文档来源提供了有价值的参考。
高维概率电力价格预测的在线多元正则分布回归
概率电力价格预测(PEPF)是短期电力市场参与者的关键任务。随着高频数据的日益可用以及能源市场对实时决策的需求,需要在线估计方法以实现高效模型更新。我们提出了一种在线、多元、正则化的分布回归模型,允许在解释变量条件下对所有分布参数进行建模。我们的方法基于多元分布回归与基于在线坐标下降的高效在线学习算法相结合,用于LASSO型正则化。此外,我们建议沿着多变量分布复杂依赖结构递增路径进行正则化估计,并允许简洁估计和早期停止。我们通过德国日前电力市场的首个聚焦于多元概率预测的研究之一验证了该方法,同时仅使用在线估计方法。我们将我们的方法与具有自适应边缘分布的在线LASSO-ARX模型以及结合自适应Copula的在线单变量分布模型进行比较。结果表明,允许在解释变量(如可再生能源输入或过去价格)下建模所有分布参数(包括均值和依赖结构)的多元分布回归相较于仅建模边缘并保持静态/无条件依赖结构的方法提供了更优的预测性能。此外,在线估计的速度比批量拟合提高了80到400倍以上。
魔法学:通过符号突变增强定理证明能力
形式化证明即使对经验丰富的专家而言也极具挑战性。神经定理证明(NTP)的最新进展显示出加速这一过程的潜力。然而,互联网上的形式化语料库与普通文本相比极为有限,这对NTP构成了显著的数据稀缺性挑战。为了解决这一问题,本研究提出了一种名为Alchemy的一般数据合成框架,该框架通过符号突变构造形式化定理。具体来说,对于Mathlib中的每个候选定理,我们确定所有可以用于重写或应用到该定理的可调用定理。随后,通过将陈述中的相应项替换为其等价形式或前提条件,对候选定理进行突变。结果表明,我们的方法使Mathlib中的定理数量增加了两个数量级,从11万增加到600万。此外,我们在这个扩充语料库上对大型语言模型进行了持续预训练和有监督微调。实验结果表明,我们的方法的有效性,在Leandojo基准测试中实现了4.70%的绝对性能提升。此外,基于合成数据的分布外miniF2F基准测试显示,我们的方法获得了2.47%的绝对性能增益。为了提供进一步的见解,我们对合成数据组成和训练范式进行了全面分析,为开发强大的定理证明器提供了宝贵的指导。
利用非结构化稀疏性在全同态加密深度神经网络中的应用
在隐私敏感环境中部署深度神经网络(DNN)受到全同态加密(FHE)计算开销的限制。本文探索了FHE矩阵乘法方案中的非结构化稀疏性,作为一种在保持模型精度要求的同时减轻这一负担的方法。我们证明了稀疏性可以在任意矩阵乘法中被利用,在所有稀疏水平上相比基准的简单算法提供运行时优势。这与明文域的情况形成了显著对比,在明文域中稀疏性和稀疏乘法算法的开销之间存在权衡。此外,我们基于常见的明文稀疏编码提出了三种FHE中的稀疏乘法方案。我们证明了性能提升对方案不变;然而,在高稀疏值下,某些稀疏方案极大地减少了加密矩阵的内存存储需求。我们提出的稀疏方案在50%非结构化稀疏性下平均性能提升2.5倍,而我们的多线程方案在使用64个核心时比等效的单线程稀疏计算性能提升32.5倍。
使用语言能力考试测试低资源语言在LLM中的支持:卢森堡语案例研究
大型语言模型(LLMs)已成为学术界和社会的重要工具。尽管LLMs被全球专家和普通用户广泛使用,但它们的研发主要面向英语使用者,在英语和其他广泛使用的语言上表现良好,而像卢森堡语这样资源匮乏的语言则被视为次要优先事项。这种忽视也反映在可用评估工具和数据集的稀缺性上。本研究调查了语言能力考试作为卢森堡语评估工具的可行性,发现大型模型如ChatGPT、Claude和DeepSeek-R1通常能获得高分,而小型模型的表现较弱。我们还发现,这类语言考试中的表现可以预测其他自然语言处理(NLP)任务中的表现。
基于里德堡极化子的可切换方向单光子发射器
全光转向或路由单光子对于量子网络至关重要。尽管在理论上和实验上已经在各种系统中进行了研究,但具有许多输出端口且与大规模光子电路兼容的单光子转向仍需进一步探索。在这里,我们展示了基于里德堡极化子的可切换方向单光子发射器。通过受激拉曼跃迁改变存储光子的里德堡成分,并利用特定的中间态,通过调节提取激光的方向,可以将发射的光子导向多种替代模式。在此方案的基础上,我们提出了一种具有\textit{N}个输出通道和统一路由效率的单光子量子路由。此外,该协议减少了运动去相位的影响,将光子寿命延长至$>10~\mu$s(超过光子处理时间的$>20$倍),从而实现了基于里德堡极化子的功能性量子器件。
对数$A$-超几何级数${\textrm I}\!{\textrm I}\!{\textrm I}$
本文是探索$A$-超几何系统的Frobenius方法系列研究的第三篇。Frobenius方法是一种经典的通过扰动方程解的指数构造对数级数解的技术。我们证明了所有$A$-超几何级数解均可通过此方法获得。基于先前的研究,我们发展了一种形式幂级数与微分算子之间的对偶框架,引入了关于通用权的极小向量,并建立了关于$A$-超几何级数对数系数的关键结果。我们将Frobenius方法推广并证明其在构造所有$A$-超几何级数解中的充分性。此外,我们探讨了先前研究所发展的Frobenius方法何时足够有效的问题,并提出了一个关于扩展方法必要性的开放问题。
共 13511 条搜索结果
共 13511 条