分类
从量子世界到经典宇宙
现代宇宙学理论认为,宇宙中的所有结构都源自于量子涨落。理解这些涨落的量子到经典转变不仅对量子理论的基础具有重要意义,而且对观测天文学也至关重要。在我的贡献中,我回顾了这一转变的基本特征,特别强调了Alexei Starobinsky的作用。
人工智能弥合早期科学教育差距:评估大型语言模型在幼儿科学教育中的工具价值
幼儿科学教育对于培养科学素养至关重要,然而,将复杂的科学概念转化为适合幼儿年龄的内容对教育者来说仍然充满挑战。本研究评估了四种领先的大型语言模型(LLMs)——GPT-4、Claude、Gemini 和 Llama,在生物学、化学和物理学领域生成适合学龄前儿童的科学解释的能力。通过30名幼儿园教师使用已确立的教学标准进行系统的评估,我们发现这些模型在创建引人入胜、准确且适合发展的内容方面存在显著差异。出乎意料的是,Claude在生物主题上的表现优于其他模型,而所有LLMs在抽象化学概念方面都遇到了困难。我们的研究结果为利用AI进行早期科学教育的教育者提供了实用见解,并为开发人员提升LLMs的教育应用提供了指导。结果强调了使用LLMs弥合早期儿童科学素养差距的潜力及其当前局限性。
AcubeSAT任务的星上计算机
AcubeSAT是一项开源立方星任务,旨在利用紧凑型微流控芯片实验室平台探索微重力和辐射对真核细胞的影响。该项目由色雷斯亚里士多德大学的志愿者跨学科学生团队SpaceDot开发,并得到欧洲航天局(ESA)教育办公室“飞你的卫星!3”计划的支持。这颗纳卫星配备了一个自主研发的星上计算机分系统,负责执行地面指令、获取遥测数据、在轨时间同步、在轨软件更新以及故障恢复。该分系统基于一块兼容PC/104标准的印刷电路板(PCB),一侧为星上计算机(OBC),另一侧为姿态与轨道控制分系统(AOCS),并与LibreCube标准兼容。所搭载的子系统功能隔离,各自采用ARM Cortex-M7架构的抗辐射微控制器。在送往太空之前,需要进行严格的测试,该星上计算机板经历了振动和热循环测试,以确保其在各种条件下的正常运行。本文旨在阐明定制板及其配套内部软件的设计决策过程、设计迭代和开发阶段。还将分享从欧洲航天局立方星支持设施进行的初步部分成功的环境测试活动中的见解,以及随后于2024年4月进行的测试准备、结果和经验教训。此外,还将讨论当前的开发状态,以及未来的电磁兼容性测试、在FlatSat上的集成计划,以及这种开源设计作为一种成本效益高、模块化且可轻松适应未来任务的解决方案的前景。
基于图的变异提取方法
准确的变异描述在遗传学领域至关重要。该领域面临日益复杂的变异类型,使得生成恰当的变异描述变得更加困难。我们提出了一种基于所有最小比对的图,它能够完整表示一个变异,并提供了三种互补的提取方法从该图中推导变异描述。实验结果显示,与dbSNP相比,我们的方法对于简单变异能生成相同的HGVS描述,而对于复杂变异则能生成更具意义的描述。
S2CFormer:基于Transformer的图像压缩中解码延迟与率失真权衡的再探讨
基于Transformer的图像学习压缩(LIC)在解码延迟与率失真(R-D)性能之间存在次优权衡问题,同时基于FeedForward Network(FFN)的信道聚合模块的重要作用被严重忽视。我们的研究表明,高效的信道聚合——而非复杂且耗时的空间操作——是实现具有竞争力的LIC模型的关键。基于这一洞见,我们提出了“S2CFormer”范式,这是一种简化空间操作并增强信道操作的一般架构,以克服先前的权衡问题。我们展示了两种S2CFormer实例:S2C-Conv和S2C-Attention。这两种模型均表现出最先进的(SOTA)率失真性能,并显著提高了解码速度。此外,我们引入了S2C-Hybrid,这是一种增强变体,通过最大化不同S2CFormer实例的优势,实现了更好的性能-延迟权衡。该模型在Kodak、Tecnick和CLIC Professional Validation数据集上超越了所有现有方法,为高效高性能的LIC设定了新的基准。代码可在\href{https://github.com/YunuoChen/S2CFormer}{https://github.com/YunuoChen/S2CFormer}获取。
持续小样本行人再识别:CFReID
实际监控系统处于动态演化过程中,要求行人再识别模型能够持续处理来自不同域的新数据。为应对这些动态变化,提出了终身行人再识别(LReID),通过增量方式学习并积累多域知识。然而,LReID 模型需要针对每个未见过的域在大规模标注数据上进行训练,但由于隐私和成本问题,这些数据通常是不可访问的。本文提出了一种新的范式,称为持续小样本行人再识别(CFReID),要求模型使用少量样本数据进行增量训练,并在所有已见域上进行测试。在小样本条件下,CFReID 面临两个核心挑战:1)从未见域的小样本数据中学习知识;2)避免对已见域的知识遗忘。为解决这两个挑战,我们提出了基于特征分布视角的稳定分布对齐(SDA)框架。具体而言,我们的 SDA 包含两个模块,即元分布对齐(MDA)和基于原型的小样本适应(PFA)。为了支持 CFReID 的研究,我们在五个公开可用的行人再识别数据集上建立了评估基准。大量实验表明,我们的 SDA 在小样本条件下增强了小样本学习和抗遗忘能力。值得注意的是,我们的方法仅使用 5% 的数据(即 32 个身份 ID),显著优于需要 700 到 1,000 个身份 ID 的 LReID 最新方法。
威胁爬虫:基于BERT的网络安全领域聚焦爬虫
公开信息中包含有价值的情报信息,可用于预防其他系统已发生的攻击。理想情况下,初始攻击成功后,后续攻击应被检测并阻止。然而,虽然存在不同的信息交换标准,但许多情报仍以非标准化的方式在文章或博客中共享。手动浏览多个在线门户和新闻页面以发现新威胁并提取相关信息是一项耗时的任务。为自动化部分扫描过程,多篇论文提出了使用自然语言处理(NLP)从文档中提取妥协指标(IOCs)的提取器。然而,尽管这已经解决了从文档中提取信息的问题,但对这些文档的搜索却很少被考虑。本文提出了一种名为ThreatCrawl的新聚焦爬虫,它使用基于Transformer的双向编码表示(BERT)模型对文档进行分类,并动态调整其爬取路径。尽管ThreatCrawl在对文本中提到的开源情报(OSINT)特定类型(例如IOC内容)进行分类方面存在困难,但它能够成功找到相关文档并相应地修改路径。其收获率最高可达52%,据我们所知,这优于当前的技术水平。结果和源代码将在接受后公开发布。
LHC Run 3期间ATLAS实验的软件与计算
ATLAS实验为LHC的Run 3开发了广泛的软件和分布式计算系统。详细描述了这些系统的各个方面,包括软件基础设施与工作流、分布式数据和任务管理、数据库基础设施以及验证。文中还介绍了如何利用这些系统准备用于物理分析的数据并评估其质量,以及用于数据分析本身的软件工具。此外,还提供了这些项目向Run 4发展的展望。
水中4'-羟基苯乙酮结晶的分子见解:溶质聚集、液液相分离与多晶型选择
通过热显微镜、微量差示扫描量热法、密度和声速测量以及分子动力学模拟的结合,获得了在不同4'-羟基苯乙酮(HAP)从水中成核之前溶液中发生的结构重排的见解。结果证实了我们之前的观察,即HAP的冷却结晶由液液相分离(LLPS)介导,并且根据最初选择的浓度范围,选择性地导致不同晶型的形成。对LLPS开始前溶液性质的分析表明,在xHAP < 0.004(I区)的HAP摩尔分数范围内,最终结晶为水合物H2的小型溶剂化簇最初存在于溶液中,随着温度的降低,其大小、形状和HAP/H2O比例保持大致不变。对于xHAP > 0.005范围(III区),其中无水I型结晶,大型HAP/水聚集体(当xHAP接近0.005限值时甚至可以渗透整个系统)最初就存在于溶液中。随着冷却的进行,这些聚集体变得更加紧凑,这一过程伴随着水分含量的减少,并且溶液浓度越高,这种减少越显著。0.004 < xHAP < 0.005(II区)范围对应于一个过渡区域,在此区域内,随着xHAP的增加,溶液的物理性质最初从I区的典型特性演变,而在某个点突然改变并开始向III区的典型特性收敛。在所有区域中,LLPS形成的胶体颗粒(结晶由此产生)在冷却过程中也可以减少其含水量,但这个过程的程度随着xHAP从形成水合物的I区和II区移动到形成无水I型的III区而增加。
CMS在13 TeV能标下强耦合常数测量的回顾:贡献于2024年莫里翁德QCD会议第五十八届研讨会
强耦合常数是标准模型中耦合常数中最不为人知的一个,但它却出现在LHC所有过程截面计算中。我们综述了CMS实验中强耦合常数的测量工作,重点关注在13 TeV质心能量下的测量结果。
基于重参数化DDIM的InPO:用于高效扩散模型对齐的反转偏好优化方法
不使用显式奖励的情况下,直接偏好优化(DPO)利用配对的人类偏好数据微调生成模型,这种方法在大型语言模型(LLMs)中引起了相当大的关注。然而,针对文本到图像(T2I)扩散模型与人类偏好的对齐研究仍较为有限。与监督微调相比,现有的扩散模型对齐方法由于马尔可夫链过程较长且逆过程不可解析,导致训练效率低且生成质量较差。为了解决这些局限性,我们提出了DDIM-InPO,这是一种高效的扩散模型直接偏好对齐方法。我们的方法将扩散模型视为单步生成模型,从而可以选择性地微调特定潜在变量的输出。为了实现这一目标,我们首先通过重参数化技术为任何潜在变量分配隐式奖励。然后构建一种反转技术,以估计适合偏好优化的潜在变量。这一修改过程使扩散模型仅微调与偏好数据高度相关的潜在变量的输出。实验结果表明,我们的DDIM-InPO仅需400步微调即可达到最先进的性能,在人类偏好评估任务中超越了所有T2I扩散模型的偏好对齐基线。
传感器失效下的多模态语义分割基准测试:缺失和噪声模态鲁棒性
多模态语义分割(MMSS)通过整合不同模态间的互补信息来克服单模态数据的局限性。尽管取得了显著进展,但由于多模态数据质量的多样性和不确定性,研究与实际部署之间仍存在显著差距。因此,实用性MMSS应用需要具备鲁棒性。然而,缺乏标准化的基准评估方法阻碍了进一步发展。为解决这一问题,我们首先综述现有MMSS文献,并对代表性方法进行分类,提供结构化的概述。随后,我们引入一个鲁棒性基准,评估MMSS模型在三种场景下的表现:完全缺失模态(EMM)、随机缺失模态(RMM)和噪声模态(NM)。从概率论的角度出发,我们基于两种条件建模模态失效:(1)所有损坏组合具有相等概率;(2)每个模态独立失效,遵循伯努利分布。在此基础上,我们提出了四种指标——$mIoU^{Avg}_{EMM}$、$mIoU^{E}_{EMM}$、$mIoU^{Avg}_{RMM}$ 和 $mIoU^{E}_{RMM}$——用于评估模型在EMM和RMM条件下的鲁棒性。这项工作提供了首个专门针对MMSS鲁棒性的基准测试,为推动该领域的发展提供了新的见解和工具。源代码可在https://github.com/Chenfei-Liao/Multi-Modal-Semantic-Segmentation-Robustness-Benchmark获取。
分布鲁棒联邦学习:一种ADMM算法
联邦学习(FL)旨在利用分散的数据协作训练机器学习(ML)模型,绕过了集中式数据聚合的需求。标准的FL模型通常假设所有数据来自相同的未知分布。然而在实际情况中,分散的数据常常表现出异质性。我们提出了一种新的FL模型,即分布鲁棒联邦学习(DRFL),它通过应用分布鲁棒优化来克服由数据异质性和分布模糊性带来的挑战。我们为DRFL推导出一个可处理的重构形式,并基于交替方向乘子法(ADMM)算法开发了一种新颖的求解方法来解决该问题。我们的实验结果表明,DRFL在数据异质性和模糊性下优于标准FL模型。
化学反应网络中的Cramér-Rao界与绝对灵敏度
化学反应网络(CRN)是一类重要的模型,用于理解生物功能,如细胞信息处理、代谢通路的稳健性和控制、昼夜节律等。然而,任何描述特定功能的CRN都不是孤立存在的,而是更大网络的一部分,因此始终受到外部变化的影响。在[Shinar, Alon, 和 Feinberg. "化学反应网络的敏感性和鲁棒性."《SIAM应用数学杂志》(2009): 977-998.]中,研究了CRN对线性守恒量变化的响应,即灵敏度,并提出了如何构建绝对的、即与基无关的灵敏度的问题。本文通过应用信息几何方法,提供了这样的构造。其想法是追踪特定化学物质浓度的变化如何传播到稳态下所有浓度的变化,这被编码在绝对灵敏度矩阵中。作为主要的技术工具,证明了一个针对CRN的多元Cramér-Rao界,该界基于准热力学稳态与指数族概率分布之间的类比。这导致了准热力学CRN的绝对灵敏度矩阵的一个线性代数特征刻画。作为一个例子,IDHKP-IDH乙醛酸旁路调控系统的中心模块通过浓度空间的大规模随机抽样进行了分析,并从实验上确认了IDH酶的稳健性发现,揭示了分布层面上隐藏的对称性,为CRN的稳健性属性分析提供了蓝图。
长Kitaev链极限下Poor Man's Majorana的命运
最小的Kitaev链,由两个通过超导体连接的量子点组成,可以承载高度局域化的近零能态,称为Poor Man's Majoranas(PMMs)。这些态被提议作为研究全Kitaev链拓扑相Majorana束缚态(MBSs)的理想候选体系。然而,目前尚不清楚实际系统中观察到的PMMs是否真正与完整的Kitaev链的拓扑相相关联。在这里,我们利用微观模型研究了PMMs,并表明在长链极限下,并非所有的PMMs都与拓扑态有关。实际上,在长链中,一些PMMs演化为平凡的低能高度局域化态。我们解释了这些态的出现,并证明没有明确的电导特征能够区分演变为真实拓扑态的PMMs和演变为平凡态的PMMs。
基于分室机制模型评估西尼罗河病毒溢出风险的概率方法
本文提出了一种新颖的概率方法,用于评估西尼罗河疾病(WND)向人类群体溢出的风险。评估是在两种不同情景下进行的:(1)评估溢出发生的可能性,(2)评估疾病发生后疫情严重程度的评估。构建了一个微分方程的分室模型来描述疾病传播机制,并基于该模型推导出病原体向人类溢出的概率密度函数,用于评估溢出发生的可能性和疫情的严重程度。预测策略包括长期预测并结合短期更新(提前两周或每日更新)。通过加利福尼亚州病例数较高的县(如橙县、洛杉矶县和克恩县)的详细爆发数据演示了该方法,并将预测结果与加利福尼亚公共卫生部报告的2022年至2024年的实际感染日期进行比较,以评估预测准确性。使用对数评分系统评估预测性能,并与最著名的预测模型之一进行比较,以评估其有效性。在所有预测场景中,模型均表现出色。最后,应用该方法探讨全球变暖对溢出风险的影响,揭示了高风险天数数量呈现增加趋势,并且这些天数在时间分布上逐渐向更高比例转变的趋势。
统计发散度和互信息变化率的界限:基于随机热力学的研究
统计发散度是数据分析、信息论和统计物理中的重要工具,并且已知存在关于其边界的一些不等式。然而,在涉及时间演化的许多情况下,需要对这些量的变化率进行限制。本文推导了若干f-发散度变化率的一般上界,适用于任意类型的随机动力学(包括马尔可夫过程和非马尔可夫过程),并以信息类和/或热力学可观测量的形式表达。作为特例,得到了互信息变化率的解析界限。在所有这些限制中,时间Fisher信息扮演了主要角色,它表征了全局系统动力学的速度,其中一些限制包含熵产生,表明了与随机热力学的联系。实际上,这些推导出的不等式可用于估计热力学随机系统的最小耗散和全局速度。给出了这些不等式在物理学和神经科学中的具体应用,其中包括非平衡系统中自由能和功的变化率界限、学习突触中信息获取速度的限制,以及预测推理和学习速率的变化率界限。总体而言,所得的界限可以应用于任何相互作用元素的复杂网络中,其中网络动力学的可预测性和热力学特性是首要关注的问题。
鲁棒信息检索@SIGIR 2025:第一届鲁棒信息检索研讨会
随着信息检索(IR)技术的发展,鲁棒性正日益受到关注。在将技术投入实际应用时,我们不仅要考虑其在正常条件下的平均性能,更重要的是其在各种异常情况下的功能保持能力。近年来,关于信息检索鲁棒性的研究涵盖了理论、评估、方法论和应用等多个方面,并呈现出增长趋势。本次研讨会的目的是系统化每个研究方面的最新成果,促进该领域内的全面交流,同时将鲁棒信息检索的研究与更广泛的社区联系起来,推动鲁棒信息检索的进一步发展。为了避免小型会议的单向讨论,本次研讨会采用高度互动的形式,包括圆桌讨论和小组讨论环节,以鼓励与会者积极参与并进行有意义的交流。
基于去中心化自治组织的能源捐赠算法:ED-DAO
能源是现代生活的基本组成部分,驱动着日常活动的方方面面。因此,无法在需要时获取能源是一个重要的问题,亟需创新解决方案。本文提出了一种名为ED-DAO的全新完全透明且社区驱动的去中心化自治组织(DAO),旨在促进能源捐赠。我们通过探索多种方法并基于捐赠能源的来源和资金来源对这些方法进行分类,分析了能源捐赠过程。我们提出了一个新颖的混合能源捐赠(HED)算法,该算法能够接受来自外部和内部捐赠者的贡献。外部捐赠来源于慈善机构和组织等实体,其能源来源于公用电网和产消者,而内部捐赠则来自拥有剩余能源的同行贡献者。HED算法按照以下顺序优先考虑捐赠:同行来源的能源(P2D)、公用电网来源的能源(UG2D)以及同行直接捐赠的能源(P2PD)。通过融合这些捐赠方式,HED算法增加了捐赠能源的总量,提供了一种更有效的解决能源贫困的手段。我们在数据集上进行了实验,以评估所提出方法的有效性。结果显示,与其它算法(UG2D、P2D和P2PD)相比,HED算法使总捐赠能源至少增加了0.43%(相当于64兆瓦)。
四维闵可夫斯基空间中大自旋质量粒子BRST拉格朗日表述的研究
我们简要回顾了关于自由大自旋质量粒子规范不变拉格朗日表述的BRST方法,并着重讨论两个具体方面。首先,理论在四维平坦空间中被考虑为具有两个分量标量和旋量场的自旋张量场,这相较于那些采用矢量指标场的方法显著简化了整个方法,因为现在无需在BRST电荷中引入与场迹相关的约束。其次,我们发展了一个极其简单且清晰的程序来消除所有辅助场,并证明BRST运动方程严格再现了给定质量和自旋的庞加莱群不可约表示的基本条件。类似于无质量理论,大自旋质量粒子的最终拉格朗日表述以三重态形式给出。BRST表述导致一个明确划分为基本自旋$s$场、Zinoviev型辅助场、Singh-Hagen型辅助场以及特殊BRST辅助场的场系统。这些辅助场可以通过规范固定和/或利用运动方程部分消除。这允许获得形式上不同(具有不同数量的辅助场)但等价的拉格朗日表述。
共 13511 条搜索结果
共 13511 条