返回周报列表

🗓 arXiv 论文周选 (2026-W21)

更新时间:2026-05-24

📚 学科:eess.* & math.* (电气工程与数学)

本周亮点:eess 领域涵盖视觉推理分割、自动泊车、生物信号提取、安全强化学习及语音识别等方向。SegCompass 利用稀疏自编码器提升推理分割可解释性,达到或超越现有顶尖性能;N3P 通过三阶段学习将自动泊车路径规划速度提升 80% 以上。math 领域本周缺少高价值论文。

SegCompass: Exploring Interpretable Alignment with Sparse Autoencoders for Enhanced Reasoning Segmentation

分数:7 📄 论文链接 🏆 CVPR 2026

提出了 SegCompass,一个端到端模型,利用稀疏自编码器 (SAE) 构建显式、可解释且可微的对齐路径。给定图像-指令对,SegCompass 首先生成思维链 (CoT) 轨迹,然后将 CoT 和视觉标记映射到共享的高维稀疏概念空间中,提供了比隐式查询更具追溯性的"白盒"连接。在五个挑战性基准测试上达到或超越现有顶尖性能,并证明稀疏概念质量与掩码准确度之间存在强相关性。

N3P: Accelerated Automated Parking via a Learning-Based Naturalistic Three-Stage Scheme

分数:3 📄 论文链接 🏆 IEEE ITSC 2026

提出 N3P,一种快速的基于学习的三阶段自动泊车框架。通过引入中间准备位姿并使用学习模块对其进行预测,N3P 将复杂的机动动作分解为更简单的子问题,降低计算复杂度并加速路径生成。增强后的 Hybrid A* 算法规划速度提升 80% 以上,且在成功率和轨迹质量方面均优于强化学习基准方法。

Time-varying rPPG signal separation via block-sparse signal model

分数:3 📄 论文链接 🏆 IEEE ICIP 2026

提出了一种利用 rPPG 信号拟周期特性的提取方法。将时频域中的拟周期性建模为块稀疏结构,构建了时变信号分离框架,以实现光照波动下的自适应信号分离,在公开数据集上验证了该方法的有效性。

Kernel-Based Safe Exploration in Deep Reinforcement Learning

分数:3 📄 论文链接 🏆 L4DC Conference 2026

展示了如何使用核嵌入在未知动力学的随机系统学习过程中同步学习障碍函数。KBSE 算法在探索过程中同时学习最优策略和障碍函数,障碍函数以条件均值嵌入的形式表示,随着探索的增加提供更好的概率安全保证。当检测到安全违规时,算法会干预并将不安全动作修改为安全动作。

Effective User-defined Keyword Spotting with Dual-stage Matching, Multi-modal Enrollment, and Continual Adaptation

分数:3 📄 论文链接 🏆 TASLP

引入 DMA-KWS 框架:采用双阶段匹配流水线(CTC 解码配合流式音素搜索,随后进行精细化验证);多模态注册融合了用户特定语音与文本嵌入以提高准确性;提出参数高效的持续适配机制,使用合成和真实数据进行轻量级更新。在 LibriPhrase 数据集上达到 97.85% 的 AUC,仅需更新 187k 参数即可实现高效的设备端部署。

📚 学科:q-bio.* (定量生物学)

本周亮点:研究集中在蛋白质-配体相互作用、社会动力学建模及药物分子筛选。HCLBind 通过分层对比学习提升了多结构域蛋白质结合亲和力的预测精度;TACK 对 PROTAC 降解活性预测进行了系统性统计评估,挑战了复杂模型必然优于传统方法的假设。

Hierarchical Contrastive Learning for Multi-Domain Protein-Ligand Binding

分数:4 📄 论文链接 🏆 ISBRA 2026

引入 HCLBind,将几何表示学习与亲和力回归解耦的自监督框架。提出分层负采样策略:模型通过单结构域蛋白质的坐标扰动学习局部物理化学约束,并通过多结构域复合物的域间旋转学习全局构象几何。能有效学习判别性的界面特征并提供鲁棒的不确定性估计,克服了标准监督学习的局限性。

How hate spreads online and why it returns: Re-entrant phases driven by collective behavior

分数:3 📄 论文链接

提出了结合易感-感染-恢复 (SIR) 动力学的双物种聚合-断裂模型,纳入仇恨社区在监管较少平台上生成内容并跨平台建立链接的真实特征。解析解和数值模拟表明传播受"回返阈值相位"支配:随着仇恨社区比例变化,系统可能从传播转为不传播再回到传播,警示相关政策可能适得其反。

TACK: A statistical evaluation of degradation activity on a novel TArgeting Chimeras Knowledge dataset

分数:3 📄 论文链接 🏆 KDD '26

介绍了 TACK,包含 3,514 种 PROTAC 及其降解终点的标准化数据集。通过严格统计比较发现经典方法(XGBoost 和 MLP)在活性预测方面显著优于领域专用的图神经网络模型。特征消融实验显示细胞上下文特征的重要性,并提出了基于集成的不确定性量化方法,实现置信度感知的实验优先级排序。

📚 学科:cs.* (计算机科学)

本周亮点:精选论文涵盖视觉语言导航、自动驾驶数据生成、生成式视频推理及医疗影像等前沿方向。AwareVLN (CVPR 2026) 为导航模型配备自我感知推理机制;Sensor2Sensor (CVPR 2026) 利用生成式模型将行车视频转化为多模态传感器数据;MotiMotion (ICML 2026) 将运动控制重表述为"推理后生成"问题。

AwareVLN: Reasoning with Self-awareness for Vision-Language Navigation

分数:7 📄 论文链接 🏆 CVPR 2026

提出 AwareVLN,为导航模型配备自我感知推理机制的框架。包含两大创新:(1) 培养空间和任务导向自我感知的结构化推理模块;(2) 带有进度划分的自动化数据引擎。在 Habitat 模拟器上显著优于之前的顶尖方法,能在不依赖额外 3D 传感器的情况下实现显式且可解释的推理。

Sensor2Sensor: Cross-Embodiment Sensor Conversion for Autonomous Driving

分数:6 📄 论文链接 🏆 CVPR 2026

提出将野外单目行车记录仪视频转换为高保真、多模态传感器套件(多视图图像和 LiDAR 点云)的新型生成建模范式。通过 4D 高斯溅射 (4DGS) 重建和扩散架构,克服了缺乏配对训练数据的挑战,能将海量互联网视频转化为可用于自动驾驶系统验证和训练的多模态格式。

MotiMotion: Motion-Controlled Video Generation with Visual Reasoning

分数:4 📄 论文链接 🏆 ICML 2026

将运动控制重新表述为"推理后生成"问题。利用无需训练的视觉语言推理器细化主轨迹并幻化合理的次要运动,置信度感知控制方案利用生成先验校正低置信度输入下的伪影。在 MotiBench 基准上,生成的视频在物体行为和交互合理性方面表现更优。

Synthetic Data Alone is Enough? Rethinking Data Scarcity in Pediatric Rare Disease Recognition

分数:4 📄 论文链接 🏆 CVPR 2026 Workshop

研究了在极低资源环境下仅使用合成数据的可行性。实验发现,在足够规模下,完全在表型感知合成面部图像上训练的模型可达与真实数据基准相当的性能,表明高保真合成数据可近似临床上有意义的分布,在保护隐私的同时支持遗传教育和临床辅助诊断。

On the Parameterized Complexity of Min-Sum-Radii

分数:3 📄 论文链接 🏆 SWAT 2026

研究了无向图诱导度量下 MSR 聚类的参数化复杂度。证明了 MSR 在加权二分图上是 W[1]-困难的(以簇数 k 为参数),且在顶点覆盖数加 k 的参数下依然困难,但在参数为树宽加聚类成本时属于 FPT(固定参数可解)。

📚 学科:astro-ph.* (天体物理学)

本周亮点:精选论文涵盖从恒星物理到星系演化的广阔尺度。研究包括利用 VLA 对碰撞风联星同步辐射极化信号的搜索,基于印度 Aditya-L1 卫星对太阳耀斑铁荧光特征的首次详尽分析,以及在原恒星核 L1544 中对双极扩散现象的直接检测。

Search for radio polarization in the particle-accelerating colliding-wind binaries WR 147 and HD 167971

分数:3 📄 论文链接

利用 VLA 观测了 PACWB 系统 WR 147 和 HD 167971。尽管预期存在线性极化,但在 L 和 C 波段均未探测到显著信号(极化度上限约 1%),可能是由于辐射区磁场的湍流性质、法拉第旋转引起的去极化以及热发射导致的稀释效应。

Iron Fluorescence in X-class Solar Flares: Aditya-L1/SoLEXS Observations

分数:3 📄 论文链接

利用印度 Aditya-L1 任务中的 SoLEXS 载荷,对 47 个 X 级耀斑的铁 Kα 荧光特征进行了首次综合分析。确定了铁 Kα 流量与激发流量之间的稳定关系,并观察到符合理论模型的中心到边缘依赖性,证明了现代硅漂移探测器可作为探测日冕源高度的新诊断工具。

Probing the ion-neutral drift velocity towards the L1544 prestellar core: Detection of ambipolar diffusion using N₂D⁺ and para-NH₂D

分数:3 📄 论文链接

观测了原恒星核 L1544 中的氘代离子 N2D+ 和中性物质 NH2D,发现了约 0.05 km/s 的速度偏移,这是双极扩散的观测证据,强调了尘埃颗粒生长在调节致密核向原恒星坍缩动力学演化中的作用。

Pulsar timing solutions for 17 pulsars at 150 MHz from the Irish LOFAR station

分数:3 📄 论文链接

展示了爱尔兰 LOFAR 单站作为独立望远镜对脉冲星后续观测和计时的能力。2020-2023 年间对 33 颗候选脉冲星进行监测,成功探测到 22 颗,为其中 17 颗提供了 150 MHz 下的相干计时解,7 颗首次报告计时解。

The habitability trade-off: Chemical decoupling and quenching in massive galaxies

分数:3 📄 论文链接

使用 IllustrisTNG 模拟研究发现约 31.5% 的大质量恒星形成星系存在系统性的恒星-气体化学解耦。揭示了"宜居性权衡":气体稀释和淬灭降低了未来类地行星的形成效率,但也为现有行星创造了辐射危害受抑的短暂宜居窗口。仙女座星系 (M31) 与此类解耦星系表现出相似特征。

📚 学科:stat.* (统计学)

本周亮点:在生成式 AI、不确定性量化及基础理论方面贡献了重要研究。Beyond Temperature (ICML 2026) 深入探讨了 LLM "超拟合"现象的几何机制,为多样化生成提供了新见解;MMD-Balls (EIML@ICML 2026) 引入 MMD 球与信念集理论,为模型可靠性提供了 PAC-Bayesian 保证。

Beyond Temperature: Hyperfitting as a Late-Stage Geometric Expansion

分数:6 📄 论文链接 🏆 ICML 2026

证明了 LLM 超拟合增强生成多样性的现象并非简单的温度缩放,而是依赖于动态的、上下文相关的排序重排机制。层级分析显示效应定位在最后一个 Transformer 块的"终端扩张"中,特征空间发生了约 80.8 维的几何扩张,促进了长尾标记的提取。提出 Late-Stage LoRA,仅更新最后 5 层即可实现稳健生成。

MMD-Balls as Credal Sets: A PAC-Bayesian Framework for Epistemic Uncertainty in Test-Time Adaptation

分数:6 📄 论文链接 🏆 EIML@ICML 2026

开发了一个 PAC-Bayesian 框架,将源分布周围的 MMD 球解释为不精确概率理论中的信念集,从而实现了自然的认知不确定性量化。该理论分离了认知与偶然不确定性,并提供了原则性的决策标准,用于确定何时需要进行模型自适应。

Bayesian Nonparametrics: Principles and Practice

分数:3 📄 论文链接

《贝叶斯非参数化》(Cambridge University Press, 2010) 一书的扩展序言。解释了贝叶斯非参数化在现代统计中的重要性,回顾了该领域的历史背景,概述了书中的核心内容,并探讨了面临的挑战及未来发展方向。

Three Costs of Amortizing Gaussian Process Inference with Neural Processes

分数:3 📄 论文链接 🏆 ProbNum 2026

界定了 GP 与神经过程预测之间的 KL 散度,并将其分解为三个来源:标签污染、信息瓶颈和摊销误差。将架构尺寸与内核平滑度和输入维度直接联系,提出具体架构建议,如仅从位置预测方差及使用二阶池化来减小误差。

On the Sample Complexity of Discounted Reinforcement Learning with Optimized Certainty Equivalents

分数:3 📄 论文链接 🏆 RLC 2026

研究了具有生成模型的折扣 MDP 中的风险敏感强化学习。精确刻画了使 OCE 定义的目标为 PAC 可学习的效用函数特征,并建立了相应的样本复杂度上下界。对于 CVaR 风险度量,改进了其对风险水平参数的依赖项。

📚 学科:econ.* (经济学)

本周亮点:关注社交网络中的行为传播动力学。通过对在线仇恨内容传播的建模,研究者探讨了复杂网络中的相变现象,指出仇恨内容扩散不仅取决于单个社区的活动,更取决于社区间动态链接与平台监管政策的交互,为数字经济下的内容治理提供了重要的博弈论与动力学参考。

How hate spreads online and why it returns: Re-entrant phases driven by collective behavior

分数:3 📄 论文链接

利用 SIR 动力学和聚合-断裂模型揭示了在线仇恨内容传播的阈值相位现象。研究特别指出,监管政策可能引发"回返相位",即减少仇恨社区数量的努力在跨越特定阈值后可能反而导致仇恨传播的卷土重来。