分类
1900-1950年间中国历史文献中分词、词性标注与命名实体识别的比较分析
本文对比了大规模语言模型(LLMs)与传统自然语言处理(NLP)工具在处理1900年至1950年中国文本时进行分词、词性标注(POS)以及命名实体识别(NER)的能力。由于历史汉语文献采用表意文字、缺乏自然词边界且存在显著的语言变化,给文本分析带来了挑战。利用上海图书馆民国期刊语料库中的样本数据集,将传统工具如Jieba和spaCy与LLMs(包括GPT-4o、Claude 3.5和GLM系列)进行了对比。结果表明,LLMs在所有指标上均优于传统方法,但其计算成本也显著更高,这凸显了准确性和效率之间的权衡。此外,LLMs能够更好地应对特定体裁带来的挑战,例如诗歌以及时间上的变化(即1920年前后文本),展示了其上下文学习能力可通过减少领域特定训练数据的需求来推动历史文本的NLP方法发展。
弱$\mathbb{Z}_2$超拓扑
晶体对称性可以强制使材料的所有能带都具有拓扑性质,这一特性通常被称为“超拓扑”。在此,我们确定了具有弱自旋轨道耦合(SOC)和强自旋轨道耦合的非磁性中心对称材料的对称性强制$\mathbb{Z}_2$超拓扑。对于弱(即可忽略的)SOC,晶体对称性可以强制保护由$\pi$-Berry相位决定的狄拉克节线;而对于强SOC,晶体对称性可以在三维布里渊区的二维子平面中产生非平凡的弱$\mathbb{Z}_2$拓扑。我们列出了所有强制这些$\mathbb{Z}_2$超拓扑的中心对称空间群,并识别出合适的材料实现,讨论了超拓扑的实验特征,如量子自旋霍尔态。
基于通用偏好与逐步偏好优化的美学后训练扩散模型
生成视觉上有吸引力的图像对于现代文本到图像生成模型而言至关重要。提升美学效果的一种潜在解决方案是直接偏好优化(DPO),该方法已被应用于扩散模型以改善包括提示对齐和美学在内的整体图像质量。现有的DPO方法通过从干净图像对传播偏好标签至两条生成轨迹的所有中间步骤来实现这一目标。然而,现有数据集中提供的偏好标签混合了布局和美学意见,这可能与纯粹的美学偏好相冲突。即使提供了美学标签(需付出高昂成本),两轨迹方法也难以捕捉不同步骤间的细微视觉差异。为经济地提升美学效果,本文利用现有的通用偏好数据,并引入逐步偏好优化(SPO)方法,摒弃传播策略,允许对图像细节进行精细化评估。具体而言,在每个去噪步骤中,我们:1)通过共享噪声潜在值采样候选池;2)利用步长感知偏好模型找到合适的胜败对以监督扩散模型;3)从候选池中随机选择一个用于初始化下一去噪步骤。此策略确保扩散模型专注于微妙且精细的视觉差异,而非布局方面。我们发现,通过积累这些改进的小差异,美学效果可以显著提升。在微调Stable Diffusion v1.5和SDXL时,与现有DPO方法相比,SPO在美学方面表现出显著改进,同时与原始模型相比并未牺牲图像-文本对齐能力。此外,由于使用了更正确的偏好标签,SPO的收敛速度比DPO方法快得多。
关于通过高阶截段逼近Hardy $Z$-函数的研究
Hardy $Z$-函数的截段由$Z_N(t):=\sum_{k=1}^{N}\frac{\cos(\theta(t)-\ln(k)t)}{\sqrt{k}}$定义,其中任意$N\in\mathbb{N}$。这些截段以两种方式逼近Hardy $Z$-函数:(a)当$\widetilde{N}(t)=\left[\sqrt{\frac{t}{2\pi}}\right]$时,$2Z_{\widetilde{N}(t)}(t)$是Hardy-Littlewood近似泛函方程(AFE)的逼近;(b)当$N(t)=\left[\frac{t}{2}\right]$时,$Z_{N(t)}(t)$是Spira的逼近。基于实验观察,Spira推测,不同于经典的逼近(a),逼近(b)在实部零点的意义上满足黎曼假设(RH)。我们通过加速级数的新技术提供了理论依据,证明这一推测本质上等价于RH本身。
质量为零四环传播子半包容割集的主积分
我们通过微分方程的方法,给出了质量为零四环传播子的三粒子、四粒子和五粒子半包容割集的所有主积分的解析计算结果。我们通过将半包容积分约化为其完全包容的对应形式,利用积分约化(IBP)方法确定了积分常数。我们通过计算下一至下一至下一阶(N3LO)半包容的\( e^+e^- \to X \)截面,并直接对微分变量进行积分,验证了我们的结果。我们将结果以机器可读的形式提供。这些积分对于直接计算NNLO时空中分裂函数和N3LO系数函数至关重要,而这些在精确QCD计算中起着关键作用。
使用ATLAS探测器在$\sqrt{s}=13$ TeV质子-质子对撞下测量高质量$\tau\bar{\tau}$产生截面及对新粒子和耦合的限制
利用大型强子对撞机(LHC)上ATLAS探测器记录的140 fb$^{-1}$的$\sqrt{s}=13$ TeV质子-质子对撞数据,测量了高质量$\tau$轻子对产生截面随双轻子可见不变质量的变化关系。测量结果与标准模型的预测一致。通过对不变质量分布进行拟合,并按$b$-喷注多重数分项分析,约束了由有效场论描述的非共振新粒子产生,或包含轻子夸克或$Z'$玻色子的模型,这些模型倾向于与第三代费米子耦合。新粒子的约束比之前的实验结果有所改善,而对有效算符的约束包括影响$\tau$轻子异常磁矩的算符。
钕离子作为NdNiO$_2$中的电荷库:从长程有序的缺失到电子掺杂诱导的反铁磁性
我们研究了电子掺杂的无限层镍酸盐NdNiO$_2$中的磁性。我们对包含镍和钕轨道的紧束缚模型进行了无限制Hartree-Fock计算。我们重现了电荷逃逸到钕能带的自掺杂效应。通过将所有自由参数固定为实际值,我们发现未掺杂的NdNiO$_2$位于相图的反铁磁(AFM)区域之外。这与实验结果一致,实验发现NdNiO$_2$基态中不存在长程有序,但观察到短程反铁磁关联和宽广的磁激发。最后,我们发现自掺杂效应在电子掺杂时导致反铁磁解的稳定性显著增加——这种行为与铜氧化物中观察到的行为截然不同。
基于反应堆和加速器实验观测的中微子振荡对Leggett-Garg不等式的评估
我们重新审视了中微子振荡数据中Leggett-Garg不等式破坏的研究,以此检验量子力学的一些基本方面。特别地,我们考虑了Daya Bay和RENO反应堆实验以及MINOS和NOvA加速器实验的结果。我们发现,Daya Bay和MINOS表现出强烈的Leggett-Garg破坏迹象,而RENO和NOvA的数据则显示出较弱的指示。考虑到每个实验所探索的具体基线和能量范围,我们的结果表明,在所有研究的数据集中,对于较小的基线与能量比值,Leggett-Garg破坏更为明显,这是在寻找中微子振荡中量子力学退相干证据时需要考虑的一个重要方面。
平面圈可扩图的刻画
对于完美匹配相关问题的研究,通常可以限制在匹配覆盖图上——即连通非平凡且每条边都包含在一个完美匹配中的图。这类图也被称为1-可扩图(因为每条边都可以扩展为一个完美匹配),其文献非常丰富,包括Lovász和Plummer提出的耳分解定理。若图 \( G \) 的一个圈 \( C \) 满足 \( G-V(C) \) 存在一个完美匹配,则称该圈为一致圈;这类圈在完美匹配的研究中尤为重要,特别是在研究Pfaffian定向问题时。若匹配覆盖图 \( G \) 中每个偶圈 \( C \) 都是一致圈,或者等价地,\( C \) 的每个完美匹配都能扩展到 \( G \) 的完美匹配中,则称 \( G \) 为圈可扩图。这类图也被称为圈良好的图或1-圈共振图。Zhang、Wang、Yuan、Ng和Cheng [Discrete Mathematics, 345:7 (2022), 112876] 给出了爪自由圈可扩图的刻画。Guo和Zhang [Discrete Mathematics, 275:1-3 (2004), 151-164] 以及Zhang和Li [Discrete Applied Mathematics, 160:13-14 (2012), 2069-2074] 分别独立给出了二部平面圈可扩图的刻画。本文建立了所有平面圈可扩图的刻画——通过 \( K_2 \) 和四个无穷族来描述。
硅基GHz光纤频率梳
我们展示了一种基于二氧化硅衬底的1 GHz Yb-光纤激光器频率梳,利用“光学立方体”容纳所有光学组件,确保长期稳定性和实用性操作。飞秒激光器和f-to-2f干涉仪均构建在二氧化硅砖块上,占地面积为290 mm × 250 mm,总重量为1.8 kg。该系统提供稳定的重复率、偏移频率以及跨越460-1560 nm的超连续光谱,无需放大。载波包络偏移频率表现出极高的稳定性,归一化频率不稳定度在1秒平均时间为$3.07\times 10^{-18}$,在10,000秒时提高到$2.12\times 10^{-20}$,连续运行超过60小时不间断。这项工作展示了高性能的GHz光纤频率梳,为实验室外的应用铺平了道路,包括双梳光谱学、天文光谱仪校准和便携式光学钟等。
基于关键点引导扩散模型的单样本飞机SAR到光学图像翻译
合成孔径雷达(SAR)图像提供了全天候、全时段及高分辨率的成像能力,但其独特的成像机制使得解释高度依赖专家知识,限制了可解释性,特别是在复杂目标任务中。将SAR图像转换为光学图像是一种增强解释能力和支持下游任务的有前景的解决方案。大多数现有研究集中在场景级转换,由于缺乏配对数据以及准确保存轮廓和纹理细节的挑战,关于目标级转换的工作有限。为了解决这些问题,本研究提出了一种基于关键点引导扩散模型(KeypointDiff)的未配对飞机目标SAR到光学图像转换框架。该框架通过关键点引入目标类别和方位角的监督,并针对未配对数据设计了一种训练策略。在此基础上,基于无分类器引导的扩散架构,设计了一个类别-方位引导模块(CAGM),将类别和方位信息整合到扩散生成过程中。此外,采用对抗损失和一致性损失,提高图像保真度和细节质量,特别适用于飞机目标。在采样过程中,借助预训练的关键点检测器,该模型消除了手动标注类别和方位信息的需求,实现了自动化的SAR到光学图像转换。实验结果表明,所提出的方法在多个指标上优于现有方法,提供了一种高效且有效的目标级SAR到光学图像转换及其下游任务解决方案。此外,在关键点检测器的帮助下,该方法对未训练的飞机类型表现出强大的零样本泛化能力。
软X射线与星系之间的互相关:星系演化模型的新基准
本文基于Legacy Survey(第10版数据发布)星系目录构建并验证了完整的恒星质量选择、体积受限的星系样本,覆盖约16,800平方度的星外天空,并延伸至红移$z<0.35$。我们以百分之一级别的统计不确定性和高达5%的系统不确定性测量了这些星系的相关函数。通过拟合一个包含四个参数的晕占据分布(HOD)模型,我们恢复了宿主晕的群体,得到了与当前星系形成和演化模型一致的恒星到晕质量关系结果。利用这些完整的星系样本,我们在约13,000平方度范围内测量并分析了SRG/eROSITA在0.5-2 keV能段内观测到的所有软X射线光子与星系之间的互相关(X-corr)。互相关测量具有前所未有的亚百分比统计不确定性以及5%-10%的系统不确定性。引入了一种扩展的晕模型来解释X-corr,分解了点源发射、热气体(CGM)、卫星以及两晕项的贡献。对于低恒星质量阈值($\log M^*/M_{\odot}>$ 10, 10.25, 10.5),我们发现点源发射在小分离尺度($r<80$kpc)下主导了X-corr。然后,在范围($80<r<2$Mpc)内,大型晕中宿主星系的发射占主导地位。最后,在超出本文考虑范围的尺度($r>2$Mpc)上,两晕项成为主导。有趣的是,在任何尺度上,CGM都没有占据主导地位。在范围($20<r<200$kpc)内,CGM对信号的贡献超过10%。随着最低恒星质量逐渐增加,CGM发射逐步增强。我们使用最低质量阈值样本限制了$M_{500c}-L_X$标度关系斜率,得到的结果为$1.629^{+0.091}_{-0.089}$,精度达到5%。
多个对跖点意味着多个邻近点
假设$\left\{x_1, \dots, x_n\right\} \subset \mathbb{R}^2$是一组平面上的$n$个点,其直径$\leq 1$,即$\|x_i - x_j\| \leq 1$对所有$1 \leq i,j \leq n$成立。我们证明,如果存在许多“对跖点”,即距离$\geq 1-\varepsilon$的一对点,则也存在许多“邻近点”,即距离$\leq \varepsilon$的一对点。更确切地说,我们证明了对于某个普适常数$c>0$, $$ \# \left\{(i,j): \|x_i - x_j\| \leq \varepsilon\right\} \geq \frac{c \cdot \varepsilon^{3/4}}{\left( \log \varepsilon^{-1} \right)^{1/4}}\cdot \# \left\{(i,j): \|x_i - x_j\| \geq 1- \varepsilon\right\}. $$ 当因子为$\varepsilon^2$时该不等式非常容易证明,而当因子为$\varepsilon$时则较为简单。最优的速率可能是$\varepsilon^{1/2}$,这由若干例子达到。
关于非闭域上的有理二重点
我们计算了所有有理二重点奇点的方程,并确定了它们在完美基域 $k$ 上的类型,这些奇点作为有限线性约化子群概形在 $\textrm{SL}_{2,k}$ 下的商奇点出现。
Gemma 3技术报告
我们介绍了Gemma 3,这是Gemma家族轻量级开源模型的一个多模态扩展版本,参数规模从10亿到270亿不等。此版本引入了视觉理解能力,覆盖了更广泛的语言,并支持更长的上下文——至少12.8万个标记。我们还调整了模型架构,通过增加局部注意力层与全局注意力层的比例并缩短局部注意力的跨度,减少了因长上下文导致的KV缓存内存爆炸问题。Gemma 3系列模型采用蒸馏训练方式,在预训练和指令微调版本中均优于Gemma 2。特别是我们的新型后训练方法显著提升了数学、对话、指令跟随和多语言能力,使Gemma3-4B-IT在基准测试中与Gemma2-27B-IT相当,而Gemma3-27B-IT则与Gemini-1.5-Pro相当。我们将所有模型发布给社区。
有限群的独立性和强独立性复形
设 $G$ 是一个有限群。2024年,Cameron 引入了有限群子集的两个不同概念的独立性(即独立性和强独立性),从而定义了两个单纯复形,其顶点为 $G$ 的元素。强独立性复形 $\tilde\Sigma(G)$ 实际上是独立性复形 $\Sigma(G)$ 的子复形。我们讨论了这些复形的一些不变性质,并基于我们的结果和构造的例子提出了一些问题。随后,我们研究了有限交换群上的特殊情形,给出了实现这些复形的有限群的刻画。最后,回答了 Cameron 提出的一个问题,我们对所有两种独立性概念一致的有限群进行了分类。
脑类器官计算——概述
本文旨在概述脑类器官计算的特点及其在人工智能领域未来应用中的潜在优势,并附有涵盖该主题所有相关方面和问题的详尽参考文献。
基于注意力与经济情绪预测美国股市波动率
宏观经济变量对股票市场有显著影响,但由于公告频率和时间变化、市场预期改变以及新闻逐渐被定价等因素的挑战,其对价格波动的预测能力尚未得到充分探索。为解决这些问题,我们利用社交媒体、新闻文章、信息消费数据和搜索引擎,估计公众对十项预定宏观经济变量的关注度与情绪。我们采用标准方法和机器学习方法,并证明能够改善我们样本中几乎所有404只主要美国股票的波动率预测。使用宏观经济公告情绪的模型在所有经济部门均能持续提高波动率预测准确性,在极端价格变动日的平均提升幅度达到14.99%,优于基准方法。改进幅度随用于估算关注度和情绪的数据来源而异,并在机器学习模型中得以体现。
AdS$_5$ 泡沫几何学的精确全息描述
全息对偶为渐近反德西特(Anti-de Sitter)超引力解提供了微观解释。场论的对偶态产生了轻算符期望值。这些期望值对应于超引力场不变组合的渐近展开系数。我们研究了IIB理论在AdS$_5 \times $S$^5$ 上与4D $\mathcal{N}=4$ 超对称杨-米尔斯理论之间的对偶关系,重点关注半BPS子扇区。我们澄清了精确全息字典的结构,明确区分单迹算符和单粒子算符,后者包含多迹混叠。我们将半BPS算符的全息字典重写为单粒子基底中的四维情形。然后,我们应用此字典对Lin、Lunin和Maldacena推导的光滑超引力解类中的两个不同解进行了精确全息研究,这些解最近被用于通过重轻关联函数的外推计算所有轻算符的四点关联函数。
STU超引力模型中Kerr-Newman黑洞熵的对数修正
已知黑洞熵的量子引力修正主要表现为一个普适的对数项。在本研究中,我们探讨了STU超引力模型中黑洞的对数修正,这些模型属于特定的$U(1)^2$带电爱因斯坦-麦克斯韦-标量理论的玻色子截断。我们展示了如何通过在4维中的特殊嵌入选择,从带电和不带电、旋转和静止的黑洞出发,恢复Kerr-Newman-AdS和Kerr-Newman黑洞族。我们使用两种不同的欧几里得量子引力设定,分别计算了极端和非极端极限下嵌入黑洞的对数修正。我们的计算基于壳上热核方法及Seeley-DeWitt展开的计算。值得注意的是,与平直空间的情况相比,所有AdS$_4$的结果均表现出非拓扑性质,为理解黑洞微观状态提供了一个自然且更全面的“红外窗口”。
共 13511 条搜索结果
共 13511 条