AI论文简报

Archives
Log in
May 14, 2026

δ-mem用8×8矩阵换长上下文

  • δ-mem外挂8×8状态矩阵:frozen主干不变、delta-rule在线更新,记忆密集任务上较基线提升10–15%,把长上下文从"扩窗口"重新表述为"设计状态机"。
  • CausalCine把shot boundary当一等公民,原生多镜头训练加按相关性检索KV的CAMR,效果接近双向模型同时保留流式交互。
  • 多轮activation steering漂移的具体机制:被steer的token写进KV cache后被反复消费成累积漂移,下移到attention-delta层后第10轮trait保留率从78%拉回93%。
  • SenseNova-U1把"理解+生成分裂"定义为结构问题——157个upvote说明社区在等可信的unified VLM,但仅凭摘要难判断和Chameleon/Janus一系的实质差别。

也值得关注

  • Mela借神经科学consolidation思路设计层级记忆模块 — 把test-time瞬时经验通过cross-frequency coupling固化为稳定表征,和δ-mem一起构成今天"状态机记忆"的另一条路线。Mela
  • agent memory benchmark从"记user history"升级到"记环境/接口/失败模式" — LongMemEval-V2把long-term memory放进web agent的真实使用场景里评测,长程记忆评测的目标对象第一次接近"有经验的同事"。LongMemEval-V2
  • research agent的skill库、memory、policy三者协同进化 — NanoResearch回应不同用户在资源、方法学、输出格式上的差异,把个性化当前提而非后处理。NanoResearch
  • 基于Unreal Engine 5的可控视觉仿真框架 — LychSim目标是降低做闭环optimization和OOD评测时的图形学门槛。LychSim
  • agent积累的知识库会被incompleteness/incorrectness/redundancy污染 — DeepRefine用RL把refinement本身做成可学习环节,而不是事后人工清洗。DeepRefine
  • 训agent从便宜的小实验中学规律,再去配置贵的大实验 — 大规模LLM实验配置太贵以致无法靠trial-and-error AutoML,AutoLLMResearch绕开这个矛盾。AutoLLMResearch
  • 单个神经元就能绕过safety alignment — refusal neuron和concept neuron的mechanistic分工,给red teaming和alignment审计都提供了具体抓手。原文
  • Jina v5-omni用locked aligned tower保留各模态原本的几何结构 — 不粗暴对齐到同一空间,是做多模态检索/embedding服务的工程参考。jina-embeddings-v5-omni
  • 复杂interleaved instruction下性能下滑的结构成因 — 图文交错多图编辑/生成的scaling规律,给统一视觉生成的接口设计提供依据。Images in Sentences
  • 量子纠错的neural decoder在throughput/latency下被重新审视 — QEC流水线中神经网络应该承担什么角色的系统性讨论。原文

阅读完整版 →

Don't miss what's next. Subscribe to AI论文简报:
Powered by Buttondown, the easiest way to start and grow your newsletter.