δ-mem用8×8矩阵换长上下文


            
        May 14, 2026
    
    
δ-mem用8×8矩阵换长上下文


δ-mem外挂8×8状态矩阵：frozen主干不变、delta-rule在线更新，记忆密集任务上较基线提升10–15%，把长上下文从"扩窗口"重新表述为"设计状态机"。


CausalCine把shot boundary当一等公民，原生多镜头训练加按相关性检索KV的CAMR，效果接近双向模型同时保留流式交互。


多轮activation steering漂移的具体机制：被steer的token写进KV cache后被反复消费成累积漂移，下移到attention-delta层后第10轮trait保留率从78%拉回93%。


SenseNova-U1把"理解+生成分裂"定义为结构问题——157个upvote说明社区在等可信的unified VLM，但仅凭摘要难判断和Chameleon/Janus一系的实质差别。


也值得关注

Mela借神经科学consolidation思路设计层级记忆模块 — 把test-time瞬时经验通过cross-frequency coupling固化为稳定表征，和δ-mem一起构成今天"状态机记忆"的另一条路线。Mela
agent memory benchmark从"记user history"升级到"记环境/接口/失败模式" — LongMemEval-V2把long-term memory放进web agent的真实使用场景里评测，长程记忆评测的目标对象第一次接近"有经验的同事"。LongMemEval-V2
research agent的skill库、memory、policy三者协同进化 — NanoResearch回应不同用户在资源、方法学、输出格式上的差异，把个性化当前提而非后处理。NanoResearch
基于Unreal Engine 5的可控视觉仿真框架 — LychSim目标是降低做闭环optimization和OOD评测时的图形学门槛。LychSim
agent积累的知识库会被incompleteness/incorrectness/redundancy污染 — DeepRefine用RL把refinement本身做成可学习环节，而不是事后人工清洗。DeepRefine
训agent从便宜的小实验中学规律，再去配置贵的大实验 — 大规模LLM实验配置太贵以致无法靠trial-and-error AutoML，AutoLLMResearch绕开这个矛盾。AutoLLMResearch
单个神经元就能绕过safety alignment — refusal neuron和concept neuron的mechanistic分工，给red teaming和alignment审计都提供了具体抓手。原文
Jina v5-omni用locked aligned tower保留各模态原本的几何结构 — 不粗暴对齐到同一空间，是做多模态检索/embedding服务的工程参考。jina-embeddings-v5-omni
复杂interleaved instruction下性能下滑的结构成因 — 图文交错多图编辑/生成的scaling规律，给统一视觉生成的接口设计提供依据。Images in Sentences
量子纠错的neural decoder在throughput/latency下被重新审视 — QEC流水线中神经网络应该承担什么角色的系统性讨论。原文

阅读完整版 →
    

                                Don't miss what's next. Subscribe to AI论文简报:
                            
                        
            Email address (required)