ShortNews.dev 2025-12-20
给软件开发者准备的优质简报,每日阅读 10分钟。
Hacker News
History LLMs: Models trained exclusively on pre-1913 texts
🔼 846 | 💬 401
历史语言模型项目:训练最大规模时间锁定历史LLMs的信息中心
- 项目核心是创建基于时间锁定历史数据的大型语言模型(LLMs),知识截止日期包括1913、1929、1933、1939和1946年,确保模型无法获取截止日期后的信息
- 即将发布的Ranke-4B模型家族包含40亿参数,基于Qwen3架构从头训练,使用80B历史数据token和600B时间标记文本的精选数据集
- 这些模型作为研究工具,为人文、社会科学和计算机科学提供”过去之窗”,完全避免现代信息的后见之明污染,能真实反映历史时期的认知局限
- 模型会如实再现历史文本中的观点(包括种族主义、反犹太主义和性别歧视等敏感内容),这是理解历史话语模式的关键特征而非缺陷
- 项目由苏黎世大学和科隆大学的研究团队主导,所有训练数据、检查点和代码将在近期公开,并建立负责任的学术访问框架以防止滥用
Airbus to migrate critical apps to a sovereign Euro cloud
🔼 404 | 💬 344
空客计划将关键应用迁移至欧洲主权云
- 空客正筹备一项重大合同,计划将包括ERP、制造执行系统、CRM和产品生命周期管理(飞机设计)在内的关键本地应用迁移至欧洲主权云
- 数字化执行副总裁Catherine Jestin强调,迁移主因是部分信息涉及欧洲和国家层面的高度敏感性,需确保数据处于欧洲控制之下
- 合同价值预计超过5000万欧元,期限长达十年,招标将于明年1月初启动,夏季前做出决定
- 特朗普重返白宫后贸易和地缘政治关系波动,加剧了欧洲企业对美国云服务商依赖的担忧,尤其是美国《云法案》允许当局获取海外数据中心数据
- 空客高管坦言仅80%把握找到合适解决方案,质疑欧洲云提供商是否具备足够规模,并等待监管机构明确能否真正“免受域外法律影响”
LLM Year in Review
🔼 334 | 💬 131
2025年大语言模型发展回顾:范式转变与智能重构
- 可验证奖励强化学习(RLVR)成为核心训练阶段:针对数学、代码等可验证环境进行强化学习,模型自发形成分步推理与问题解决策略,显著提升能力且性价比高,重新分配了算力资源。
- 模型智能呈现“幽灵式”非生物特性与“锯齿状”能力分布:智能结构基于文本模仿与奖励优化,在可验证领域表现卓越但其他领域脆弱,导致传统基准测试因过拟合而失效。
- Cursor类应用定义垂直领域新生态:通过上下文工程、多模型调用编排、专用界面及自主性调节功能,将通用模型转化为特定行业的专业工具,形成独立于模型研发的应用层。
- Claude Code实现本地化智能体范式突破:直接在用户计算机运行,深度融合本地环境、私有数据与低延迟交互,颠覆以云端为核心的智能体部署模式,重塑人机协作体验。
- 氛围编程(Vibe coding)彻底降低开发门槛:仅凭自然语言即可生成完整代码,非专业用户可快速创建程序,专业开发者则能高效实现原型与一次性工具,重构软件开发流程。
OpenSCAD Is Kinda Neat
🔼 101 | 💬 71
OpenSCAD:一款简洁实用的参数化3D建模工具
- 作者通过重新实现一个参数化电池盒设计来学习OpenSCAD,该工具采用代码生成3D对象而非传统图形界面操作
- 只需修改
numRows(行数)、numColumns(列数)和batteryType(电池类型)三个变量即可生成定制化电池盒模型 - 核心代码通过
cube()绘制主体盒子,再利用difference()和循环嵌套的translate()切割出电池孔洞 - 作者发现OpenSCAD特别适合生成轴承垫片、间隔环等简单但实用的几何形状,无需启动重型CAD软件
- 虽然对复杂设计帮助有限,但代码化操作使得模型可重复生成且输出效果与传统CAD软件无异
I spent a week without IPv4
🔼 53 | 💬 60
禁用IPv4一周后,我对IPv6过渡机制的深度体验
- 作者禁用IPv4连接一周,测试了双栈、NAT64和464XLAT等IPv6过渡机制的实际表现和局限性
- 约50%的常用网站已原生支持IPv6,但许多网络管理员仍缺乏部署动力,建议采用IPv6优先的网络设计理念
- NAT64配合DNS64可在IPv6网络中访问IPv4资源,而464XLAT方案能提供更无缝的IPv4兼容体验(macOS/iOS设备原生支持)
- IPv6解决了NAT带来的端口转发和穿透问题,使P2P通信、VPN和服务器托管更简单,在CG-NAT环境下优势明显
- 实验证明IPv6已具备生产环境可用性,但需要路由器厂商和操作系统提供更好的软件支持
8-bit Boléro
🔼 316 | 💬 43
林纳斯·阿克森用自制8位乐器演奏《波莱罗》
- 使用9种自制8位乐器演奏莫里斯·拉威尔的《波莱罗》,包括Qweremin、Qwertuoso、Paulimba、次中音Commodordion、Family Bass、未命名的软驱噪声乐器、C=TAR、Chipophone和NES定音鼓
- 项目耗时半年多完成,包含9小时42分钟的原始素材、52个混音轨道和13条领结/领带
- 自动机械装置通过近距离单独采集每个硬件部分的声音,后期与画面合成,实现100%可重复演奏
- NES定音鼓采用类似《超级马里奥兄弟》的非线性电阻网络技术,通过ADPCM采样通道添加直流偏移控制音量包络
- 几乎所有段落音画同步实录,仅自动机械部分音画分离制作,提供26.2 MB的MP3格式下载
Backing Up Spotify
🔼 131 | 💬 39
Spotify数据备份项目:构建全球最大开放音乐档案
- 安娜的档案馆完成了对Spotify的元数据和音乐文件备份,数据总量约300TB,按流行度分组,通过种子文件分发,包含约8600万首音乐文件,覆盖了平台上约99.6%的播放量。
- 该项目创建了全球最大的公开音乐元数据库,涵盖2.56亿首曲目和1.86亿个唯一ISRC编码,远超其他现有数据库(如MusicBrainz仅500万ISRC)。
- 档案采用开放设计,允许任何拥有足够存储空间的人轻松镜像,旨在长期保存人类音乐文化遗产,防止因自然灾害、战争或预算削减导致的数据损失。
- 音乐文件按流行度优先级处理:流行度>0的曲目保留原始160kbit/s OGG Vorbis格式;流行度=0的曲目转换为75kbit/s OGG Opus格式以节省空间,音质对大多数人无明显差异。
- 现有音乐保存努力存在三大问题:过度聚焦热门艺术家和高质量格式(如FLAC),缺乏权威的全音乐曲目列表,而本档案试图弥补这些不足,尽管Spotify并未包含全球所有音乐。
Go ahead, self-host Postgres
🔼 298 | 💬 214
自托管PostgreSQL:打破云服务商的恐惧叙事
- 作者以两年实践经验驳斥云服务商对自托管数据库的危险宣传,其自托管PostgreSQL每日处理数千万查询,仅因手动迁移产生过30分钟故障,成本更低且稳定性出色
- 云托管服务(如AWS RDS)本质只是标准PostgreSQL搭配监控工具和备份系统,并无专属技术优势,性能测试显示自托管版本查询延迟降低20%
- 实际运维复杂度极低:月度任务仅需30分钟处理安全更新和备份核查,季度任务约2小时优化配置,与处理RDS连接限制的时间相当
- 自托管适用于绝大多数场景,仅有三类例外:初学者快速原型开发、超大规模企业需专职数据库工程师、受合规要求(如HIPAA)约束的工作负载
- 成功自托管需关注关键配置:内存参数匹配硬件(shared_buffers设内存25%)、强制使用PgBouncer连接池、针对NVMe优化I/O参数(random_page_cost=1.1)
CSS Grid Lanes
🔼 678 | 💬 208
CSS Grid Lanes:下一代CSS瀑布流布局方案
- CSS Grid Lanes 是苹果 WebKit 团队联合 CSS 工作组开发的新布局模块,现已在 Safari Technology Preview 234 中提供测试,旨在实现高效灵活的瀑布流布局
- 仅需三行核心代码(
display: grid-lanes、grid-template-columns及gap)即可创建自适应多列布局,无需媒体查询或JavaScript,适用于各种屏幕尺寸 - 支持完整 CSS Grid 功能,包括定义不同宽度车道(如交替窄宽列)、内容跨列(通过
grid-column: span N)以及显式控制项目位置(如将页眉始终置于末列) - 引入
item-tolerance属性(默认值 1em)调节布局算法对项目高度差异的敏感度,影响用户使用标签导航或屏幕阅读器时的内容顺序体验 - 自动根据
grid-template-columns(生成垂直瀑布流)或grid-template-rows(生成水平砖块流)决定布局流向,无需额外设置方向属性
GitHub Trending
lintsinghua / DeepAudit
⭐ 2008 | 🔀 213 | Python 59.4%, TypeScript 36.4%, Shell 1.2%
DeepAudit:基于Multi-Agent协作的下一代代码安全审计平台
- 采用Multi-Agent协作架构,通过Orchestrator、Recon、Analysis、Verification四个智能体自主协作,实现深度代码理解、漏洞挖掘和自动化沙箱PoC验证。
- 解决传统SAST工具痛点:高误报率、业务逻辑盲点、缺乏验证手段,支持全自动识别技术栈、分析风险、生成脚本、验证漏洞并生成专业报告。
- 提供一行命令快速部署和国内镜像加速(如南京大学镜像站),支持本地开发调试和二次开发,覆盖SQL注入、XSS、命令注入等十余种漏洞类型。
- 兼容国内外主流LLM平台(OpenAI、Claude、通义千问、智谱等)及Ollama本地部署,确保数据不出内网,满足隐私和合规要求。
- 功能包括RAG知识增强、项目管理、即时分析、报告导出等,严格遵循法律合规,仅限授权环境用于教育、研究和合法目的。
github / awesome-copilot
⭐ 14983 | 🔀 1763 | JavaScript 99.6%
GitHub Copilot 自定义资源大全
- 提供专门化的 GitHub Copilot 代理、提示和指令,涵盖不同领域、语言和用例,以增强 Copilot 体验
- 包含五大核心资源:自定义代理、任务特定提示、代码标准和最佳实践指令、技能包以及主题化集合
- 提供 MCP 服务器支持,可通过 Docker 在 VS Code 或 Visual Studio 中直接搜索和安装自定义内容
- 预置精选集合,如“Awesome Copilot”元提示和合作伙伴开发的 20 个 DevOps 及云基础设施代理
- 支持通过 Copilot 聊天命令(如
/awesome-copilot create-readme)快速调用提示,提升开发效率和代码一致性
cloudcommunity / Free-Certifications
⭐ 47099 | 🔀 3174
免费认证课程资源全览
- 精心汇总各类免费认证课程,涵盖通用技术、安全、数据库、项目管理、市场营销及杂项六大领域,所有课程均提供官方认证
- 已上线用户友好型网站 free-certifications.com,并将于2025年2月至3月推出免费认证资讯订阅服务
- 合作机构包括GitLab、Oracle、freeCodeCamp、AWS、Google Cloud、IBM、华为、微软等知名企业,部分课程设有明确有效期
- 额外提供面向非营利组织、开源项目、初创公司、教育机构及社区的专属免费资源列表,扩展免费学习机会
- 由Cloud Study Network全球技术社区维护,致力于知识共享与资源传播,所有信息均基于官方渠道,确保准确性与时效性
NexaAI / nexa-sdk
⭐ 6727 | 🔀 875 | Go 50.9%, Kotlin 23.3%, Jupyter Notebook 14.6%, Python 6.7%, Shell 2.4%
NexaSDK:跨硬件本地运行AI模型的统一开发工具包
- 基于自研NexaML引擎,可在NPU、GPU和CPU上本地运行任意AI模型,支持GGUF、MLX和.nexa三种格式,无需依赖现有运行时
- 独家支持NPU优先架构,提供Android SDK及全平台覆盖(桌面/移动/汽车/IoT),具备完整的图像/音频/文本多模态能力
- 近期突破包括:发布NPU原生视觉语言模型AutoNeural-VL-1.5B(延迟降低14倍),支持Mistral Ministral-3-3B,并实现对Apple Neural Engine的Granite-4.0等模型优化
- 提供跨平台一键安装CLI,支持单行命令运行Hugging Face模型,内置OpenAI兼容API和函数调用,支持本地文件系统模型导入
- 开发者可通过社区投票平台决定后续支持的模型,参与构建者激励计划最高可获得1500美元奖励
Indie Hacker
I killed my $50/mo Reddit marketing stack and built a free local tool
我用免费本地工具替代了每月50美元的红迪营销工具
- 作者因对每月50美元的付费工具(Brand24、Chrome插件和Fiverr外包)效果不佳感到失望,取消了所有订阅服务
- 自主开发了基于Python+PyQt6的本地桌面应用,直接使用家庭IP访问红迪,避免云端工具IP被封锁的问题
- 工具核心功能包括:快速抓取5个子版块的最新200个帖子、按评论数(最多8条)和评分过滤、右键生成AI回复草稿
- 每日红迪营销流程从1小时缩短至15分钟,强调持续互动和真诚帮助的重要性,而非单纯追求转化率
- 免费版提供每日15次抓取,满足独立开发者需求;高级版支持无限制使用和AI功能,工具已命名为Reddit Toolbox(wappkit.com)
Hitting $30k MRR with an AI marketing product Richard Wang built niched down in the area of his expertise and grew a business to $30k+ MRR. Here's how.
利用AI营销产品Leadmore AI实现月收入3万美元的创业经验
- 创始人Richard Wang的旗舰产品Leadmore AI专注于B2B AI营销,月经常性收入(MRR)已超过3万美元,并保持快速增长,同时他还在开发另一款GEO方向的AI营销产品
- 采用基于积分的商业模式:用户购买积分用于发帖、评论或发现相关子版块等操作,未使用的积分支持随时退款,极大提升了用户友好度和信任感
- 强调需求验证优先于编码:通过社交媒体分享demo或创意、与潜在用户直接对话(目标50-100人)来验证付费意愿,再以1-2周快速构建最小可行产品(MVP)
- 用户增长核心靠内容营销与关系维护:在Reddit等平台分享行业洞见和实用知识,吸引用户后通过直接沟通转化,并邀请进入私域社区以促进口碑传播和长期留存
- 技术架构全面无服务器化:使用Next.js全栈框架、Go(Gin)高性能API、MongoDB存储核心数据、ClickHouse处理分析任务,并以Function Compute运行后台作业
Learning to code and building a $28k/mo portfolio of SaaS products IH+ Subscribers Only Samuel Rondot's first "product" had zero tech. Then, he learned to code and built a portfolio of products bringi...
从配镜师到月入$28K的SaaS产品组合创始人
- 创始人Samuel Rondot曾是一名配镜师,2017年通过人工操作与WordPress结合的非技术手段创立首个Instagram自动化服务MathPlanner,月收入达$30,000后辞职全职创业
- 当前SaaS产品组合包括StoryShort.ai(约$20,000/月)、UseArtemis.co(约$5,000/月,受LinkedIn自动化限制影响收入下降)和AI建站工具Capacity.so(新项目,已稳定增长至$3,000/月)
- 坚持需求验证优先原则,启动前必查搜索量、SEO指标、竞争对手实力及获客方式,避免无需求开发
- 采用极简技术栈并利用AI工具加速原型验证,强调数据驱动决策而非依赖直觉,减少资源浪费
- 结合SEO的长期积累与广告的快速测试双轨策略,逐步构建可持续订阅收入,实现财务与地理自由目标
What if your product could test itself with real users?
如果产品能自动用真实用户测试自己会怎样?
- 产品团队常声称用户研究重要,但现实中常因时间或资源不足被推迟、取消或依赖直觉决策
- 开发了名为Userology的解决方案,旨在消除用户研究对时间、协调或大团队的需求
- 用户可提交Figma原型或实际产品链接,并设定目标用户群体
- AI自动招募真实用户、运行实时可用性测试、观察屏幕操作(不仅听取反馈),并将杂乱数据转化为清晰、可执行的见解
- 无需人工安排测试、手动整理结果或拖延至“下一个迭代再做研究”
- 产品已于2025年12月20日正式发布,并邀请用户分享用户研究过程中的具体痛点
I built an app that has gained over 5,000 weekly active users.
谷歌日历浏览器扩展:提升会议提醒效率
- 该扩展由开发者Sergey_commit为解决远程工作中Google日历通知易被忽略的问题而开发,现已拥有超过5000名周活跃用户
- 核心功能是通过浏览器图标快速访问即将到来的日程、提醒和任务,无需单独打开标签页,提供持久且可视化的全天提醒
- 该工具最初是个人使用的解决方案,后经同事反馈优化并发布,定位为轻量级“会议感知层”而非替代原有日历
- 专门针对深度工作时通知一闪即消失的场景设计,避免用户因专注工作而错过重要会议
- 扩展完全免费(当前月收入为0美元),用户可通过Chrome应用商店搜索“Google Calendar Extension”获取
- 开发者积极寻求用户反馈,尤其希望从需要兼顾多场会议和深度工作的人群中获得使用体验建议
Don't miss what's next. Subscribe to shortnews.dev: