分类

利用预训练演示隐式反馈的多智能体运动生成模型直接后训练偏好对齐方法

近年来,大型语言模型(LLMs)的进步彻底改变了具身应用中的运动生成模型。虽然LLM类型的自回归运动生成模型受益于训练的可扩展性,但它们的标记预测目标与人类偏好之间仍存在偏差,导致仅基于标记预测目标训练的模型生成的行为偏离人类偏好的行为,因此后训练偏好对齐对于生成符合人类偏好的运动至关重要。然而,后训练对齐需要对预训练模型生成的大量运动进行广泛的偏好排名,这在标注上成本高昂,尤其是在多智能体设置中。最近,人们越来越有兴趣利用预训练演示来可扩展地生成后训练对齐所需的偏好数据。然而,这些方法通常采用对抗假设,将所有预训练模型生成的样本视为不被偏好的例子。这种对抗方法忽视了模型自身生成之间的偏好排名所提供的宝贵信号,最终降低了对齐的有效性,并可能导致行为对齐失败。在这项工作中,我们没有将所有生成的样本视为同样糟糕,而是利用预训练演示中编码的隐式偏好,构建预训练模型生成之间的偏好排名,提供更精细的偏好对齐指导,且无需任何人工成本。我们将该方法应用于大规模交通仿真,并展示了其在提升预训练模型生成行为真实感方面的有效性。通过仅依赖预训练演示中的隐式反馈,而无需额外的后训练人类偏好注释或高计算成本,我们的轻量级100万规模运动生成模型在性能上可以媲美基于模仿学习的大规模SOTA模型。

人工智能
机器人学
2025-03-25 发布

模拟器HC:基于回归的在线模拟几何视觉同伦连续性问题-解对

虽然自动产生的多项式消元模板在三维计算机视觉领域引发了巨大进步,但仍有许多问题由于约束的次数或未知数的数量导致难以处理。近年来,同伦连续性被引入作为一种可行的替代方法。然而,该方法目前依赖于昂贵的复杂数域内所有可能解的并行追踪,或者是在有限的真实世界示例集上训练的问题-解对分类网络。我们的创新之处在于一种新颖的方法,即仅需预测一个粗略的初始解,而相应的问题由在线模拟器生成。随后,应用同伦连续性跟踪该单一解回到原始问题。我们将这种方法应用于广义相机重标定,并且还提出了一个解决具有挑战性的广义相对姿态和尺度问题的新方案。如演示所示,所提出的方法成功补偿了单独使用回归器产生的原始误差,并实现了最先进的效率和成功率。

计算机视觉与模式识别
2025-03-25更新2024-11-06 发布

基于事件的星轨跟踪:EBS-EKF算法

由于低延迟和高能效等优势,基于事件的传感器(EBS)在星轨跟踪领域展现出巨大潜力,但此前的研究仅限于简化信号模型下的仿真评估。本文提出了一种新的基于事件的星轨跟踪算法,该算法基于对EBS电路的分析并结合扩展卡尔曼滤波器(EKF)。我们利用真实的夜空数据定量评估了该方法,并将其结果与现成的有源像素传感器(APS)星轨跟踪器进行比较。实验表明,由于信号建模和状态估计的改进,我们的方法比现有方法准确一个数量级,同时提供更高的更新频率和更大的运动容差,优于传统的APS跟踪器。我们提供了全部代码以及首个同步事件与APS解的公开数据集。

计算机视觉与模式识别
2025-03-25 发布

哥伦比亚街头毒品的EASI模型:异质性和内生药物偏好的研究

非法毒品消费者对大规模政策变化(如合法化)的反应在很大程度上受到其需求行为的影响。由于个人吸毒行为受到许多不可观测因素的驱动,考虑未观察到的异质性对于建模需求和设计有针对性的公共政策至关重要。本文引入有限高斯混合的精确仿射Stone指数(EASI)需求系统,估计哥伦比亚大麻、可卡因和basuco(可卡因残渣或“冰毒”)的需求,同时考虑角点解和内生价格变化。我们的结果显示,未观察到的异质性在识别可靠的价格弹性方面具有重要意义。该方法揭示了两个常规消费亚群体:“安全型”(娱乐型)和“成瘾型”用户,其中大多数属于前者。“安全型”群体的估计值精确且具有全国代表性,三种毒品均表现出单位价格弹性,可卡因与大麻互补,而basuco则是可卡因的劣质替代品。鉴于哥伦比亚大麻生产成本较低,合法化可能会显著降低其价格。我们的反事实分析表明,价格下降50%将使每位代表性消费者获得相当于363美元的效用支出增加,政府税收收入增加1.2亿美元,毒贩收入损失1.27亿美元。因此,合法化有可能减少与毒品相关的犯罪活动,这是哥伦比亚目前暴力犯罪的最大来源。

计量经济学
应用
2025-03-25 发布

浮点数自标记技术

动态多态语言在运行时对象中必须附加类型等信息,并因此调整值的内存布局以包含这些信息的空间。这使得高效实现IEEE754浮点数变得困难,因为该格式未预留容易访问的空间存储类型信息。目前广泛使用的两种浮点数编码方式——标记指针和NaN boxing都存在缺点:标记指针需要对所有浮点对象进行堆分配,而NaN boxing会增加类型检查以及处理其他对象的运行时开销。本文提出了一种名为自标记的新方法,可以在N位对象中附加易于访问的类型信息的同时保留其全部N位用于数据存储。自标记的核心思想是利用某些比特序列出现频率较高的特性,通过叠加这些频繁出现的序列来在同一N位机器字中同时编码N位数据和类型信息。这种方法的主要应用是分别在64位和32位机器上表示IEEE754 64位和32位浮点数。我们已经在一种JavaScript编译器和两种不同的Scheme编译器中实现了相关的自标记变体,以分析其性能并与其他方法(如标记指针和NaN boxing)进行比较。实验结果表明,该方法在实践中消除了IEEE754浮点数的堆分配,使Scheme中浮点密集型基准测试的执行时间提高了2.4倍,JavaScript中提高了3.6倍,而对其他基准测试的影响可以忽略不计,使其成为标记指针和NaN boxing的良好替代方案。

编程语言
D.3.4
2025-03-25更新2024-11-25 发布

构造性边界之分形:对可数性与连续统的元理论批判

现代数学中所采用的所有构造方法仅产生可数集,即使这些方法旨在超越可数性。我们证明,任何排除对角化技术的不可数性构造论证实际上仅在封闭的形式系统内生成可数片段。我们将这一局限性形式化为“构造性的分形边界”,即在句法上可枚举规则下所有构造扩展的渐近极限。一个核心定理表明,在任何此类系统内完全捕捉连续统结构的可能性是不存在的。我们进一步引入了“分形可数性”的概念,这是一种基于分层构造闭包的相对化可数性改进。这提供了一个框架,用于分析定义性而不诉诸于不可数的整体性。我们将连续统解释为形式表达能力的边界,而非通过构造性方式实现的对象。

数理逻辑
计算机科学中的逻辑
03D80, 03E10, 03B70
F.4.1
2025-03-25 发布

群体竞争中的参赛与信息披露

我们研究了群体间竞争的信息披露策略。每位参与者内生决定是否作为群体的一员参与竞争。群体内部的努力聚合采用最佳射手规则,即群体的表现由其成员中最高的投资决定。我们考虑了一种广义的全支付拍卖设定,在这种设定下,表现最好的群体将以确定的方式赢得竞争。在参赛阶段,玩家赢得比赛的价值是私人信息,但可能在竞争阶段被披露。我们比较了三种信息披露政策:(i) 不披露,此时参赛人数未知且玩家价值保密;(ii) 群体内披露,此时该信息仅在每个群体内部披露而不在群体之间披露;(iii) 完全披露,此时参赛者的信息在群体之间披露。对于个体间竞争的基准情况,信息披露总是会减少预期的总投资。然而,在群体竞争中,这一结论不再成立:群体内披露明确提高了总的投资量,而完全披露的效果则不明确。

理论经济学
2025-03-25 发布

量子关联的相对性:不变量与参考系依赖的度量

将参考系视为物理系统——并受描述这些系统的相同规律制约——是物理学中关系方法的核心。假设量子力学普遍适用于所有物理实体,这种观点自然引出了量子参考系(QRF)的概念。我们利用QRF形式主义研究了位置与动量不确定性、关联、协方差矩阵以及纠缠在不同参考系下的依赖性。结果表明,Robertson-Schrödinger不确定性关系是参考系依赖的,相关性和满足各种约束条件的方差亦如此。然而,总协方差矩阵的行列式(与相空间中的不确定性体积相关)以及某种类型的纠缠熵在参考系变换下保持不变。这些不变量暗示了尽管观测视角发生变化,但存在一些根本性的、稳健的不确定性与纠缠度量,这可能启发专门的量子信息协议以及进一步的基础研究。

量子物理
2025-03-25 发布

电离星云中广义的$T_e$([OIII])-$T_e$(HeI)偏差:可能的Case B偏差和温度不均匀性证据

HeI单重系的复合线(RLs)物理特性被认为相对简单,并且得到了精确原子模型的支持。我们研究了各种类型电离星云中HeI单重系$\lambda \lambda$3614, 3965, 5016, 6678, 7281以及三重系HeI$\lambda$5876的强度,并与理论预测进行比较,以检验“Case B”复合情景和热均匀性假设的有效性。我们的分析包括来自银河系和河外HII区域的85条光谱、来自恒星形成星系的90条光谱以及来自行星状星云的218条光谱,这些数据均来源于DESIRED-E项目。通过评估HeI$\lambda$7281/$\lambda$6678和HeI$\lambda$7281/$\lambda$5876的比值,我们确定了$T_e$(HeI),并与直接测量的$T_e$([OIII]$\lambda$4363/$\lambda$5007)进行了比较。结果发现,对于大多数天体和星云类型,$T_e$(HeI)系统性地低于$T_e$([OIII])。此外,我们还发现行星状星云中的丰度偏差因子(ADF(O$^{2+}$))与$T_e$([OIII])-$T_e$(HeI)的差异之间存在相关性。我们探讨了两种可能的解释:$n^1P \rightarrow 1^1S$跃迁的光子损失以及温度不均匀性。偏离“Case B”可能表明HI而非HeI吸收了电离光子和/或普遍存在的电离光子逃逸,这突显了详细考虑辐射转移效应的必要性。如果温度不均匀性普遍存在,则识别影响所有电离星云的共同物理现象至关重要。我们的结果表明这两种情景都有助于解释观测到的偏差。

星系天体物理学
2025-03-25更新2024-10-22 发布

几何代数在黑洞与霍金辐射中的应用

我们讨论了几何代数语言下规范引力理论(GTG)在黑洞和霍金辐射中的应用。这些应用包括非惯性系中的乌赫效应、狄拉克方程和克莱因-戈登方程在多种背景下的分析,例如de Sitter度规、Rindler度规以及球对称和轴对称黑洞背景。此外,还推广了包含磁单极子存在的分析。我们重新推导了所有情况下的霍金温度。正确推导出费米-狄拉克统计和玻色-爱因斯坦统计,以及霍金温度的过程表明,我们所采用的几何代数计算方法在处理各种强引力场问题时具有强大的能力。

物理学综述
经典物理
2025-03-25更新2004-12-13 发布

慢性肝病大鼠模型中脑区代谢与细胞易感性的差异

背景与目的:C型肝性脑病(HE)患者表现出多种症状,表明不同脑区受到影响。理解这些区域特有的代谢与细胞变化可能有助于解释HE临床表现的变异性。我们首次分析了胆管结扎(BDL)大鼠模型在慢性肝病(CLD)进展过程中海马、纹状体和小脑的纵向体内神经代谢及形态学变化。方法:Wistar大鼠接受BDL手术,并在BDL前后以及术后第2、4、6和8周通过海马、纹状体和小脑的体内1H-MRS(9.4T)检测、组织学评估(星形胶质细胞、小胶质细胞和神经元)及血液生化分析进行研究。结果:在所有脑区中,谷氨酰胺(Gln)是最早增加的代谢物,随后是渗透压调节物质和神经递质的减少。小脑表现出最高的Gln负荷(+134%)、乳酸升高(+84%)和γ-氨基丁酸(GABA)降低(-23%),提示其更高的易感性。这与星形胶质细胞形态显著改变相关,可能与高Gln负荷有关。相比之下,纹状体的Gln增幅最低(+48%),但渗透压调节物质降幅最大,星形胶质细胞变化较轻。此外,我们还展示了小胶质细胞(激活)和神经元(树突棘密度下降、胞体大小改变)在各脑区中的共同和独特的形态学变化。结论:我们的研究揭示了脑区对CLD的共同及差异性代谢与细胞反应,小脑和纹状体表现出不同的响应。我们推测,谷氨酰胺是C型HE早期脑代谢标志物之一,影响星形胶质细胞并不可避免地影响神经元,导致认知功能下降。

医学物理
2025-03-25 发布

欧几里得计划准备. LXVII. 弱透镜剪切偏差校准的真实星系形态深度学习方法

目前,弱透镜巡天中的星系图像模拟通常将所有星系的光度分布近似为单个或双Sérsic分布,忽略了偏离这种简化参数化特征的星系亚结构和形态的影响。尽管这一近似对先前的数据集可能已足够,但即将到来的欧几里得巡天对宇宙剪切校准的严格要求以及数据的高质量需要考虑现实星系亚结构对剪切测量偏差的影响。本文提出了一种基于深度学习的新方法,直接从哈勃空间望远镜(HST)数据中生成此类模拟星系。首先,我们构建并验证了一个基于小波散射变换的卷积神经网络,以学习不受HST星系图像点扩散函数影响的无噪声表征,并在注入欧几里得光学仪器VIS模拟图像时不会引入噪声相关性。接着,我们通过随机采样和条件采样演示了新星系图像的生成。然后,通过比较具有复杂形状的欧几里得类似模拟中模型对象样本与其最佳拟合双Sérsic对应物之间的剪切测量偏差,量化了宇宙剪切偏差。利用KSB形状测量算法,我们发现具有真实形态和参数化轮廓的分支之间存在约$6.9\times 10^{-3}$的数量级乘法偏差差异。此外,我们发现参数化和真实星系模拟的完整图像场景之间存在明显的检测偏差差异,导致独立于形状测量方法的偏差差异为$4.0\times 10^{-3}$。这使其适用于像欧几里得这样的第四阶段弱透镜巡天。

宇宙学和非星系天体物理学
星系天体物理学
2025-03-25更新2024-09-11 发布

iNatAg:基于包含470万张作物和杂草物种图像的大规模基准数据集的多类别分类模型

准确识别作物和杂草种类对于精准农业和可持续耕作至关重要。然而,由于物种间视觉相似度高、环境变化多样以及缺乏专门针对农业的大规模图像数据集,这一任务仍然极具挑战性。我们引入了iNatAg,这是一个包含超过470万张2,959种不同作物和杂草物种图像的大规模图像数据集,并在从二元作物/杂草标签到特定物种标签的分类学层级上进行了精确标注。该数据集源自更大的iNaturalist数据库,覆盖了每个大陆,准确反映了自然图像捕捉和环境的变化。借助此数据集,我们训练了基于SwinTransformer架构的基准模型,并评估了地理空间数据融合和LoRA微调等不同修改的影响。我们的最佳模型在所有分类任务中均达到了最先进的性能,在作物和杂草分类任务中达到了92.38%的准确率。此外,数据集的规模使我们能够探索错误分类并解锁植物物种的新分析可能性。通过结合大规模物种覆盖、多任务标签和地理多样性,iNatAg为构建稳健且具备地理位置感知能力的农业分类系统提供了新的基础。我们将iNatAg数据集公开发布于AgML(https://github.com/Project-AgML/AgML),以便直接访问并集成到农业机器学习工作流中。

计算机视觉与模式识别
2025-03-25 发布

全局Langlands对应中的大像集Galois表示

对于数域$F$上的$\text{GL}_n$,全局Langlands猜想预测了某些代数自守表示$\pi$与$\text{GL}_n(\mathbb{A}_F)$的某些$\ell$-进Galois表示族$\{ \rho_{\pi,\ell} \}_\ell$之间的对应关系。一般认为,除非存在自守原因导致像集较小,否则对于几乎所有素数$\ell$,剩余Galois表示$\overline{\rho}_{\pi,\ell}$的像集应尽可能大。本文仅利用标准技术及目前可用工具(如Fontaine-Laffaille理论、Serre的模性猜想、Lie型群极大子群分类、以及关于自守Galois表示不可约性和Langlands函子性的已知结果),研究了与正则代数、极化、尖点自守表示$\pi$相关的兼容系统$\{\rho_{\pi,\ell} \}_\ell$的像集。特别地,当$F$为全实域且$n$为奇素数$\leq 293$时,我们在某些自守条件下证明了剩余表示$\overline{\rho}_{\pi,\ell}$的像集对于无穷多个素数$\ell$尽可能大。实际上,当$F=\mathbb{Q}$且$n=5$时,我们证明了大像集猜想(即对于几乎所有素数$\ell$像集较大)。

数论
群论
11F80, 11F70, 20G40, 20G41
2025-03-25更新2023-06-04 发布

重量、净重量与初等子模型

本文证明了若干与[6]中的结果和问题相关的定理,并回答了其中提出的两个主要问题。首先,我们给出了一个在ZFC框架下关于$C(\omega_1)$中的Hausdorff空间的例子,该空间具有不可数净重量。然后,我们证明了在连续统假设(CH)成立的情况下,向模型添加任意数量的Cohen实数后,在扩展模型中,$C(\omega_1)$中的每个正则空间都具有可数净重量。我们还在ZFC框架下证明,对于$\omega_1$上的任何不可数重量的正则拓扑,存在一个非平稳子集,其重量也是不可数的。此外,如果$\omega_1$的所有最终片段都有不可数重量,则正则性假设可以省略。根据[6],关于净重量的类似陈述在ZFC框架下是独立的。我们的这些结果的证明均充分利用了初等子模型的方法。

数理逻辑
普通拓扑
54A25, 03E05, 03E10, 03E35
2025-03-25 发布

基于大型语言模型的母体健康干预代理模拟:不确定性估计与决策导向评估

基于代理的模拟对于建模复杂的人类行为至关重要,但传统方法需要广泛的领域知识和大量的数据集。在历史数据和反事实数据有限的医疗资源匮乏环境中,大型语言模型(LLMs)通过利用广泛的世界知识提供了一种有前景的替代方案。本研究考察了一个基于LLM的母体移动健康项目模拟,预测了受益人在接收自动化信息(对照组)或人工代表(干预组)发送的健康信息时的收听行为。由于在健康干预中的决策制定过程中不确定性量化至关重要,我们提出了一种基于多样本二元熵的LLM认识论不确定性估计方法。通过集成方法增强模型鲁棒性,相比单个模型,F1分数和模型校准均有所提高。除了直接评估外,我们采取了决策导向的方法,展示了LLM预测如何为数据匮乏环境下的干预可行性和试验实施提供信息。该方法可扩展到公共卫生、灾害响应以及其他需要在严重数据约束下快速评估干预措施的领域。本工作的所有代码和提示均可在https://github.com/sarahmart/LLM-ABS-ARMMAN-prediction找到。

人工智能
2025-03-25 发布

苹果与橘子:评估Apple Silicon M系列SoC在高性能计算性能与能效方面的表现

本文研究了Apple Silicon M系列SoC(M1、M2、M3和M4)在高性能计算(HPC)中的架构特点及性能潜力。我们对CPU和GPU设计、统一内存架构以及高级矩阵扩展(AMX)等协处理器进行了详细审查。我们使用Metal着色语言和Objective-C++开发基准测试程序,评估其FP32计算和内存性能。同时,我们利用Apple的powermetrics工具测量功耗和能效。结果表明,M系列芯片提供高达100 GB/s的内存带宽,并在计算性能上实现了显著的代际提升,其中M4的FP32峰值浮点运算能力达到2.9 TFLOPS。功耗范围从几瓦到10-20瓦不等,四款芯片均达到了超过200 GFLOPS/W的GPU和加速器能效。尽管GPU在FP64支持方面存在一定局限性,但M系列芯片仍表现出强劲的节能型HPC应用潜力。虽然现有的HPC解决方案如Nvidia Grace-Hopper超级芯片在内存带宽和计算性能上优于Apple Silicon,但我们发现M系列为传统HPC架构提供了具有竞争力的低功耗替代方案,形成了一种独特的类别——即“苹果与橘子”的比较。

计算机硬件体系结构
2025-03-25更新2025-02-07 发布

高色数和高最小出度有向图中圈的方向

我们刻画了所有满足如下条件的圈的方向 $C$:对于任意固定的 $\varepsilon > 0$,存在常数 $c \geq 1$,使得每个不含环和平行弧的有向图 $D$,若其色数 $\chi(D) \geq c$ 且最小出度至少为 $\varepsilon |V(D)|$,则 $D$ 中包含 $C$ 作为子图。这一结果推广了Thomassen的结果。

组合学
05C20 (Primary) 05C38 (Secondary)
2025-03-25 发布

浅层非弹性散射区域碳氢化合物上带电流 $\nu_\mu$ 和 $\bar\nu_\mu$ 跨截面的测量

MINERvA 的这一分析是首次对浅层非弹性散射区域的中微子和反中微子研究,该区域介于共振产生和深度非弹性散射过程之间的过渡区。通过扩展浅层非弹性散射的范围,明确包含这一过渡区域,不仅涵盖主要为低-$Q^2$ 非共振π介子产生的部分,还包括在本分析定义的深度非弹性散射区域开启之前,核子内部夸克上的π介子产生显著的动量区间。为了减少共振背景,选择了1.5 $<$ $W$ $<$ 2 GeV/$c^2$ 的动力学区间。除了整体微分跨截面测量外,还针对核子内部夸克上的浅层非弹性散射(SIS)进行了额外分析,选取了$Q^2$ $\geq$ 1 GeV/$c^2$ 的样本。以平均中微子能量$\left\langle E_\nu \right\rangle \sim 6$ GeV 在碳氢化合物上对$Q^2$、Bjorken x和μ子动量变量的一维跨截面测量结果,与GENIE 2中微子生成器的修正预测以及GiBUU、NEUT、NuWro和其他版本的GENIE 3中微子模拟器的预测进行了比较。观察到所有变量的测量值与中微子模拟器预测之间在形状和幅度上存在显著差异。

高能物理-实验
2025-03-25 发布

寻找 $B^+_c\rightarrow χ_{c1}(3872)π^+$ 衰变

使用2011年至2018年期间LHCb探测器收集的质心能量为7、8和13 $TeV$ 的质子-质子对撞数据(对应积分亮度为$9fb^{-1}$),报告了对$B^+_c\rightarrow \chi_{c1}(3872)\pi^+$ 衰变的搜索结果。未观察到显著信号。利用$B^+_c\rightarrow \psi(2S)\pi^+$ 衰变为归一化道,以90\%(95\%)置信水平得到衰变分支比之比的上限$$ \mathcal{R}^{\chi_{c1}(3872)}_{\psi(2S)} = \frac{\mathcal{B}_{B^+_c\rightarrow \chi_{c1}(3872)\pi^+}} {\mathcal{B}_{B^+_c\rightarrow \psi(2S)\pi^+}} \times \frac{\mathcal{B}_{\chi_{c1}(3872)\rightarrow J/\psi\pi^+\pi^-}} {\mathcal{B}_{\psi(2S)\rightarrow J/\psi \pi^+\pi^-}} < 0.05\,(0.06)\,. $$

高能物理-实验
2025-03-25 发布

共 13511 条搜索结果

共 13511 条