分类

基于对称性的实空间框架用于实现平带并揭示节点线接触

平带(FB)系统为研究关联物理提供了理想的平台,而真实材料中的多轨道特性与大多数简单的FB模型有所不同。在此,我们提出了一种基于对称紧凑局域态(CLS)的系统且通用的紧束缚(TB)模型FB构造框架,该框架整合了晶格和轨道自由度。首先,我们证明任何CLS都可以被对称化为点群的表示形式,并且这种表示对于具有有限自旋-轨道耦合(SOC)的高轨道仍然有效。其次,我们根据晶格对称性确定候选CLS位点,并简化跃迁为两个希尔伯特空间之间的线性映射:一个为CLS位点,另一个为其相邻位点。FB的存在依赖于该映射的非空核。最后,我们区分核中的本征态以确认其为CLS。为了展示此框架的通用性,我们构建了三个代表性FB模型:一个在二维(2D),其余在三维(3D)。它们均缺乏特殊的晶格结构并包含高轨道。值得注意的是,3D FB不仅可以表现出点接触,还可以表现出沿线的接触,这一特征具有重要的物理意义。为了全面理解,我们推导出一个简洁的标准来判断能带接触,这为理解有隙和平隙FB的发生提供了自然解释。通过统一实空间中的对称原理,我们的工作为构建多样晶格系统的FB提供了一种系统方法。此框架为理解和设计FB系统开辟了新的途径,对关联量子现象和奇异物质相具有潜在影响。

介观与纳米尺度物理
2025-03-25更新2024-12-20 发布

单态富范畴与富Rezk完备化

富范畴是其态射集带有额外结构的范畴,这类范畴在高维范畴论、同伦理论以及编程语言语义的研究中起着重要作用。本文研究单态富范畴。我们证明了任意两个单态富范畴之间的本质满且完全忠实的函子均为等价函子,并且每个富范畴都存在Rezk完备化。最后,利用富范畴的Rezk完备化构造了单态富Kleisli范畴。

计算机科学中的逻辑
范畴论
2025-03-25更新2024-01-22 发布

GRN+: 一种用于慢性腰痛患者三维超声图像组织分层分析的简化生成式强化网络

三维超声能够提供高分辨率、实时的软组织图像,这对于疼痛研究至关重要。然而,手动区分各种组织以进行定量分析耗时费力。为简化这一过程,我们开发并验证了GRN+,这是一种新颖的多模型框架,能够在标注数据最少的情况下实现自动分层分割。GRN+结合了基于ResNet的生成器和U-Net分割模型。通过一种名为分割引导增强(Segmentation-guided Enhancement, SGE)的方法,生成器在分割模型的指导下生成新的图像及其对应的掩码,并根据分割损失梯度调整其权重。为了防止梯度爆炸并确保稳定训练,实施了一种两阶段反向传播策略:第一阶段通过生成器和分割模型传播分割损失,而第二阶段专注于单独优化分割模型,从而利用生成的图像细化掩码预测。在来自29名受试者的69个完全标注的三维超声扫描数据集上进行测试,这些数据集包含六层人工标注的组织,GRN+仅使用5%的标注数据便在Dice系数方面优于所有其他半监督方法,且未使用未标注数据进行无监督训练。此外,当应用于完全标注的数据集时,采用SGE的GRN+相比其他模型实现了更高的Dice系数(提高了2.16%),同时计算成本更低。总体而言,GRN+在提供准确组织分割的同时降低了计算开销和对大量标注的依赖性,成为慢性腰痛患者三维超声分析的有效工具。

图像与视频处理
计算机视觉与模式识别
2025-03-25 发布

标量有效场论中单圈水平下的正定性界限

如果要求紫外完备化遵守量子场论的基本原理,则有效场论中的参数会受到某些正定性界限的约束。这些界限在树级水平相对简单明了,但在环效应显著时会变得更加隐晦。以标量理论为例,我们仔细考察了前向弹性振幅的主要贡献出现在单圈水平的情况下的正定性界限,并指出了正定性界限对理论参数空间含义的一些微妙之处。特别是,由单圈生成的维数为8的算符系数(若在树级生成则为正)及其$\beta$-函数通常不受正定性界限约束,因为它们可能对应于光学定理下的散射截面干涉项,其符号可以为正也可以为负。只有当考虑同一圈阶的所有贡献时,包括来自维数为4和6算符系数的贡献(这些在单圈水平上有重要影响),才能严格推导出正定性界限。我们的结果可能对正定性界限实验检验的稳健性具有重要意义。

高能物理-唯象学
高能物理-理论
2025-03-25更新2024-08-19 发布

多重敏感属性交叉偏见的一对一缓解方法:一种扩展公平感知二分类的通用方法

随着机器学习在现实世界中的广泛应用,歧视性偏见的影响引起了关注。近年来,提出了多种缓解偏见的方法。然而,大多数方法并未考虑交叉偏见,即当考虑多个敏感属性时,特定子群体的人可能会受到不公平对待的问题。为了解决这一问题,本文提出了一种名为“一对一缓解”的方法,通过比较与敏感属性相关的每对子群体来改进公平感知的机器学习二分类过程。我们使用三种方法(预处理、训练过程中处理和后处理)、六个评估指标(人口比例比与差值、相等机会率比与差值以及相等机会率差值)以及两个真实数据集(Adult和COMPAS)对我们的方法与传统的公平感知二分类方法进行了全面对比。结果表明,在所有设置下,我们的方法均能更好地缓解交叉偏见。基于此结果,我们展示了公平感知二分类方法在解决多敏感属性场景下更现实问题的潜力。

机器学习
人工智能
计算机与社会
I.6.5; I.2.6
2025-03-25更新2020-10-26 发布

谐振链中两段不相交块的纠缠哈密顿量

我们研究了谐振链在线上及其基态下两段不相交块的纠缠哈密顿量。在大质量极限下,非零项仅包含单点项和最近邻项,得到了其轮廓的解析表达式,这些轮廓可以用分段线性函数表示,这些函数可能是不连续的,并且随着块之间距离的变化表现出尖锐的转变。在零质量极限下,纠缠哈密顿量的矩阵包含所有距离上的耦合,我们探讨了次主导项的位置以及一些矩阵元的组合,这些组合对于连续极限是有用的,并将结果与自由手征电流对应的结果进行了比较。此外,还研究了这些纠缠哈密顿量的单粒子纠缠能谱。

统计力学
高能物理-理论
量子物理
2025-03-25 发布

具有可重构并行时间步计算的高效硬件加速器用于脉冲Transformer

本文介绍了首个低功耗硬件加速器,用于脉冲Transformer——一种传统人工神经网络的新兴替代方案。通过修改基础的Spikformer模型,使用IAND而非残差相加,该模型完全利用脉冲计算。硬件采用全并行的时钟批处理数据流以及时间步可重构的神经元架构,解决了脉冲神经网络中多时间步处理的延迟和功耗问题。此方法能够并行处理所有时间步的输出,减少了计算延迟,并消除了膜记忆,从而降低了能耗。该加速器通过向量化处理支持3x3和1x1卷积以及矩阵运算,满足模型需求。在TSMC 28nm工艺下实现后,在500MHz频率下达到3.456 TSOPS(每秒万亿次脉冲操作),功率效率为38.334 TSOPS/W,使用了198.46K逻辑门和139.25KB SRAM。

计算机硬件体系结构
2025-03-25 发布

一种优化数据重用的低功耗稀疏深度学习加速器

稀疏深度学习显著减少了计算量,但由于非零数据分布的不规则性,其数据流变得复杂且阻碍了数据重用,增加了片上SRAM访问次数,从而提高了芯片的功耗。本文通过最大化数据重用来减少SRAM访问,提出两种方法解决上述问题。首先,我们提出了有效的索引匹配(EIM),它能够高效地搜索并排列压缩数据中的非零操作。其次,我们提出了共享索引数据重用(SIDR),协调处理单元(PE)之间的操作,使其SRAM数据访问规律化,从而实现所有数据的有效重用。与先前的设计SparTen相比,我们的方法使SRAM缓冲区的访问减少了86%。因此,与最先进的方法相比,我们的设计在保持更简单数据流的同时,实现了2.5倍的能效提升。

计算机硬件体系结构
2025-03-25 发布

变电站物料清单:管理IEC 61850数字变电站供应链网络风险的新方法

智能电网经历了深刻的数字化进程,整合了新的数据驱动型控制和监督技术,形成了现代数字变电站(DS)。由于DS包含多厂商环境,攻击者更倾向于针对其供应链进行攻击。本研究提出了一种基于CycloneDX规范的变电站物料清单(Subs-BOM)方案,能够从网络安全视角对DS中的所有智能电子设备(IED)及其关系进行建模。所提出的Subs-BOM方案可以为与供应链相关的网络风险提供明智的决策依据,并同时支持对多个DS进行管理,从而为能源公司提供设备、运行固件和服务的准确完整清单。该Subs-BOM通过IEC 61850标准规定的变电站配置描述(SCD)文件作为主要信息源生成。我们使用OWASP的Dependency-Track软件对该Subs-BOM方案进行了验证,结果表明该方案能够被与CycloneDX兼容的工具正确识别。此外,Dependency-Track软件还可以追踪由Subs-BOM表示的IED中存在的现有漏洞。

密码学与安全
2025-03-25 发布

RobustEMD:跨域少样本医学图像分割的领域鲁棒匹配方法

少样本医学图像分割(FSMIS)旨在医学图像分析范围内利用有限标注数据进行学习。尽管已取得进展,当前的FSMIS模型均在相同数据域下训练和部署,这与临床实际情况不符,因为医学成像数据总是跨越不同的数据域(例如成像模态、机构和设备序列)。如何增强FSMIS模型以在不同特定医学成像域中表现良好?本文聚焦于少样本语义分割模型的匹配机制,并为跨域场景引入基于地球移动器距离(EMD)计算的领域鲁棒匹配机制。具体而言,我们制定了前景支持-查询特征之间的EMD传输过程,并在EMD匹配流程中引入基于Sobel的图像梯度计算方法,以节点为目标抑制与领域相关的节点。此外,引入点集级别距离测量指标,用于计算从支持集节点到查询集节点的运输成本。为了评估我们的模型性能,我们在三种场景(即跨模态、跨序列和跨机构)下进行实验,包括八个医学数据集并涉及三个身体区域,结果表明我们的模型在对比模型中达到了最先进的性能。

计算机视觉与模式识别
2025-03-25更新2024-10-01 发布

宇宙学模拟中类似银河系质量星系中的流浪中等质量黑洞:神话还是现实?

在这项工作中,我们探讨了以下问题:“我们能否利用当前的宇宙学模拟识别中等质量黑洞(IMBH)并量化潜在的流浪IMBH群体?” 我们比较了不同宇宙学模拟中使用不同亚网格方法和后处理方法的流浪IMBH数量,最终目标是为未来的流浪IMBH探测工作提供帮助。特别是,我们检查了将高红移形成的黑洞种子识别为IMBH以及使用恒星团作为代理识别IMBH(隐含了恒星动力学形成通道)的模拟。此外,我们采用极高分辨率的宇宙学流体动力学“放大”模拟GigaEris,并结合恒星团代理方法来识别IMBH。尽管不同的识别方法导致结果有所差异,但我们在目前文献中使用的大多数宇宙学模拟中发现,类似银河系大小的星系在红移$z \geq 3$时的流浪IMBH数量一致,约为每颗星系5到18个。然而,我们认为这仅是巧合,因为当考察流浪IMBH的形成位置和质量范围时,显著的差异显现出来。此外,我们无法确定GigaEris中高红移识别出的IMBH中有多少会成为红移$z = 0$时的流浪IMBH,又有多少会吸积到中心超大质量黑洞以促进其增长。这一切都对当前宇宙学模拟能够为观测搜寻流浪IMBH的能力提出了质疑。

星系天体物理学
2025-03-25更新2024-04-23 发布

140万开源蒸馏推理数据集助力大型语言模型训练

AM-DeepSeek-R1-蒸馏数据集是一个包含通用推理任务思维轨迹的大规模数据集,由高质量且具有挑战性的推理问题组成。这些问题来自众多开源数据集,并经过语义去重和细致清洗以消除测试集污染。数据集中所有回答均来自推理模型(主要是DeepSeek-R1),并经过严格验证程序。数学问题通过参考答案验证,代码问题利用测试用例验证,其他任务借助奖励模型进行评估。仅通过简单监督微调(SFT)训练的AM-Distill-Qwen-32B模型在四个基准测试(AIME2024、MATH-500、GPQA-Diamond和LiveCodeBench)上超过了DeepSeek-R1-蒸馏-Qwen-32B模型。此外,AM-Distill-Qwen-72B模型在所有基准测试上也优于DeepSeek-R1-蒸馏-Llama-70B模型。我们向研究社区发布这140万个问题及其对应回答,旨在促进强大的推理导向型大型语言模型(LLMs)的发展。该数据集已发布于\href{https://huggingface.co/datasets/a-m-team/AM-DeepSeek-R1-Distilled-1.4M}{https://huggingface.co/datasets/a-m-team/AM-DeepSeek-R1-Distilled-1.4M}。

计算与语言
2025-03-25 发布

第十四届和第十五届图计算模型国际研讨会论文集

本卷收录了第十四届和第十五届图计算模型国际研讨会(GCM 2023 和 2024)的后出版会议论文。研讨会分别于2023年7月18日在英国莱斯特、2024年7月9日在荷兰恩斯赫德举行,且每次都是STAF(软件技术:应用与基础)的一部分。图是一种常见的数学结构,具有直观的可视化特性。它们在科学、工程以及计算机科学、生物学和业务流程建模等领域中,构成了系统建模的一种自然且无缝的方式。图计算模型是一类非常高级别的模型,其中图被视为一等公民。国际GCM研讨会系列旨在汇集对基于图和图转换的计算模型感兴趣的所有方面的研究人员。它促进了对图计算模型的基础、应用和实现感兴趣的各个社区中资深研究者和年轻研究者之间的思想交流与经验分享。

计算机科学中的逻辑
形式语言与自动机理论
编程语言
软件工程
2025-03-25 发布

导数多项式与squigonometric函数的无穷级数

所有的squigonometric函数均可导,并且其导数可以表示为squine和cosquine的多项式。我们引入了一种通用框架,允许递归地确定这些多项式。同时,我们还给出了这些多项式所有系数的显式公式。这也使得我们可以给出所有squigonometric函数的MacLaurin级数系数的显式表达式。此外,我们进一步讨论了一些可以在整个实数线上以任意给定精度计算squigonometric函数的方法。

经典分析与常微分方程
cs.NA
数值分析
26A06, 26A24
2025-03-25 发布

虚拟现实在制造教育中的应用:领域、层次和实体层面的最新状态、优势与挑战综述

针对美国制造业技术劳动力短缺的问题,沉浸式虚拟现实(VR)培训解决方案具有巨大的潜力。为了有效利用VR满足劳动力需求,理解其在制造教育中的角色至关重要。因此,我们在该领域开展了一项范围综述。首先,我们采用“5W1H”(What, Where, Who, When, Why, How)公式作为问题解决方法,定义了一个全面的分类法,从所有相关可能性角度考虑VR的作用。我们的分类法从三个关键方面对VR应用进行了归类:(1)领域;(2)层次;(3)实体。通过系统性的文献检索和分析,我们回顾了108篇研究文章,以揭示VR在制造领域的现状、优势、挑战和未来机遇。研究发现,VR已在多个领域得到探索,并为学习者提供了诸多益处。尽管如此,其在制造教育中的应用仍受到限制。本综述讨论了识别出的障碍,并提出了可操作的见解以应对这些障碍。这些见解能够推动沉浸式技术的广泛应用,培养和发展具备在制造业演变环境中脱颖而出所需技能的劳动力。

人机交互
2025-03-25更新2025-03-24 发布

参与型寿险合同的均值-方差优化

本文研究了(非)受保护参与型寿险合同的股权持有人均值-方差最优投资组合选择问题。在多维Black-Scholes模型中,我们推导出了最优期末财富和最优策略的显式公式,证明了所有必要参数的存在性。在不完全市场中,我们给出了价值函数的Hamilton-Jacobi-Bellman方程。此外,我们还对Black-Scholes市场进行了数值分析。股权持有人在经济状况不佳时平均会增加对风险资产的投资,并随着时间推移减少投资。

数理金融
2025-03-25更新2024-07-16 发布

HateGPT:释放GPT-3.5 Turbo在X平台对抗仇恨言论

社交媒体平台如Twitter和Facebook的广泛使用,使各年龄段的人能够分享自己的想法和经历,从而积累了大量的用户生成内容。然而,这些平台在带来好处的同时也面临着管理仇恨言论和攻击性内容的挑战,这可能破坏理性讨论并威胁民主价值观。因此,迫切需要自动化方法来检测和减轻此类内容,特别是考虑到对话的复杂性可能需要跨多种语言(包括混合语言如印地英语、德英、孟加拉语)进行上下文分析。我们参与了英语任务,需将英语推文分类为“仇恨”和“攻击性”以及“非仇恨-非攻击性”两类。在这项工作中,我们通过提示实验了最先进的大型语言模型如GPT-3.5 Turbo,用于将推文分类为“仇恨-攻击性”或“非仇恨-非攻击性”。本研究评估了分类模型在三个不同运行中的Macro-F1得分表现。Macro-F1分数作为平衡各类别精确率和召回率的主要指标,用于模型评估。三个运行的得分分别为:第1次运行0.756,第2次运行0.751,第3次运行0.754,表明模型在各运行间性能高度一致且具有较小的方差。结果表明,该模型在精确率和召回率方面表现稳定,其中第1次运行表现出最高性能。这些发现凸显了该模型在不同运行中的稳健性和可靠性。

计算与语言
2025-03-25更新2024-11-14 发布

子划分与接近线性的稳定集

我们证明了对于每个完全图 \( K_t \),所有不含同构于 \( K_t \) 的子划分诱导子图的图 \( G \),都存在一个大小至少为 \( |G| / {\rm polylog}|G| \) 的稳定集。这接近最佳结果,因为当 \( t \geq 7 \) 时,不是所有的此类图 \( G \) 都具有线性大小的稳定集,即使 \( G \) 是无三角形的。

组合学
2025-03-25更新2024-09-14 发布

大型语言模型的安全训练是否对语义相关的自然提示具有一致性?

大型语言模型(LLMs)在采用安全微调方法与人类偏好对齐后,仍然容易受到精心设计的对抗性攻击或越狱行为的影响,导致生成不当内容。尽管输入令牌空间的高维特性使得找到能够使这些模型越狱的对抗性提示不可避免,但我们旨在评估经过安全微调的LLMs是否对那些语义上与毒性种子提示相关的自然提示具有安全性,这些种子提示在对齐后能够产生安全响应。我们惊讶地发现,流行的对齐LLMs(如GPT-4)可以被一些并非专门设计用于越狱模型的简单提示所突破。此外,我们通过实证表明,给定一个从未对齐模型中引发毒性响应的种子提示,可以系统地生成多个语义相关的自然提示,从而实现对对齐LLMs的越狱。为此,我们提出了基于响应引导的问题增强(ReG-QA)方法来评估安全对齐的LLMs对自然提示的一致性,该方法首先利用未对齐的LLM(问题到答案,Q到A)生成多个有毒的答案,然后利用另一个LLM生成可能产生这些答案的问题(答案到问题,A到Q)。有趣的是,我们发现像GPT-4o这样的安全微调LLMs在面对不安全内容时容易生成自然越狱问题(不否认),因此可以用于后者(A到Q)步骤。我们在JailbreakBench排行榜上的攻击成功率与领先对抗性攻击方法相当甚至更好,同时对Smooth-LLM和同义词替换等防御措施表现出显著更高的稳定性,这些防御措施对排行榜上的现有所有攻击都有效。

计算与语言
人工智能
2025-03-25更新2024-12-04 发布

最大幸福基准:衡量大型语言模型在功利主义道德困境中的对齐情况

如何做出最大化所有人福祉的决策,对于设计有益于人类且无害的语言模型具有重要意义。我们引入了最大幸福基准,利用功利主义困境评估大型语言模型(LLMs)的道德判断。通过对15种不同LLMs的分析发现,这些模型一致编码的道德偏好偏离了已建立的道德理论和普通人群的道德标准。大多数LLMs表现出明显的公正利他倾向,并拒绝工具性伤害。这些发现展示了LLMs的“人工道德罗盘”,为理解其道德对齐提供了洞见。

计算与语言
2025-03-25 发布

共 13511 条搜索结果

共 13511 条