FoundraLab

2026-02-03 科技圈新闻汇总

今天的热点比较“工程味”：一边是多代理/自动化开发工具链继续成型；另一边是安全与基础设施再次提醒大家，系统可靠性和默认安全配置依然是第一性问题。

AI 与机器学习

The Hot Mess of AI：模型越“会想”，失败越像“随机事故”

Anthropic 的一篇研究把大模型失败拆成经典的 bias/variance（偏差/方差）：

Bias（偏差）：稳定但错（更像“系统性追错目标”）
Variance（方差）：不稳定、前后不一致（更像“热锅上的蚂蚁/一团糟”）

他们的核心观察是：当任务更难、推理更长（更多 token 或更多 agent 动作）时，失败会越来越被 **incoherence（不一致/方差）**主导。也就是说，未来很多高风险失败可能更像“工业事故”而不是“纸夹最大化”。

Longer reasoning → More incoherence. 复杂任务上，扩大模型规模也不一定带来更强一致性。

📎 原文链接：https://alignment.anthropic.com/2026/hot-mess-of-ai/

Nano-vLLM：用 1200 行 Python 拆解推理引擎的关键机制

这篇文章用一个“迷你但够用”的 vLLM 思路实现（Nano-vLLM）来解释推理引擎内部：prefill vs decode 两阶段、调度器（waiting/running 队列）、KV cache 的 block 管理，以及 prefix caching、CUDA Graph 等性能关键点。

如果你在做自托管推理或多租户 LLM 服务，文章非常适合用来对齐概念：

为啥吞吐/延迟是根本 trade-off
为啥 KV cache 是容量瓶颈
为啥前缀缓存能把“系统提示词”场景拉满

📎 原文链接：https://neutree.ai/blog/nano-vllm-part-1

开发工具与开源

OpenAI 推出 Codex App：面向“多代理并行开发”的指挥中心

OpenAI 发布了 macOS 的 Codex App，定位更像是一个“agent command center”：

多线程/多项目同时跑 agent，适合长任务并行
支持 diff 审阅、评论、在编辑器中打开
内建 worktrees，降低多个 agent 同 repo 冲突
提到 skills/automations：把重复流程变成可复用能力

对团队来说，这类产品的关键不只是“能写代码”，而是把监督、并行、隔离、审阅的流程做顺。

📎 原文链接：https://openai.com/index/introducing-the-codex-app/

Zig Devlog：推进 zig libc，减少冗余 C 代码、提升编译与体积表现

Zig 社区在推进“zig libc”子项目：把 libc 的很多函数改为 Zig 标准库 wrapper，逐步删除仓库里冗余的 C 源码文件。文章提到目前已经删掉约 250 个 C 文件，并强调其收益：

更少第三方依赖、更强自洽
编译更快、安装体积更小
静态链接的应用二进制更小
以及更激进的设想：跨 libc 边界做类似 LTO 的优化空间

📎 原文链接：https://ziglang.org/devlog/2026/#2026-01-31

基础设施与行业

GitHub Actions 发生退化/部分故障：影响依赖 Actions 的功能链路

GitHub Status 显示 Actions 发生 degraded availability / queued jobs / failing jobs，并波及 Copilot Coding Agent、Dependabot 等依赖 Actions 的功能。事件在 UTC 2/3 00:56 左右标记为 resolved。

对 CI/CD 强依赖团队来说，这类事件的常见应对包括：

关键 pipeline 的降级路径（例如自托管 runner 或镜像构建兜底）
针对上游中断的重试/回放策略
以及把“外部依赖不可用”当作常态来设计

📎 原文链接：https://www.githubstatus.com

游戏与怀旧科技

逆向 40 年前的并口加密狗：4 字节补丁“解锁”上古软件

一篇很硬核的软件考古/逆向工程故事：作者在迁移一家会计事务所的超老系统时，遇到一个需要并口（LPT1）硬件加密狗才能运行的 DOS/Win98 时代 RPG 编译器。

关键点在于：

程序通过并口 I/O 指令和加密狗交互，最终在 BX 寄存器里得到一个“魔法常量”
作者用反汇编定位到校验例程后，发现结果没有输入、应当是常量，于是直接用 MOV BX, 0x7606; RETF 这种四字节级别的小补丁绕过
更“爽”的是：编译器会把同一套校验逻辑复制进产物里——所以补丁过的编译器会产出同样“去狗”的可执行文件

这类文章很适合拿来提醒团队：安全机制如果只是在客户端做“常量校验”，最终一定会变成“可脚本化的开关”。

📎 原文链接：https://dmitrybrant.com/2026/02/01/defeating-a-40-year-old-copy-protection-dongle

开发工具与开源（补充）

Termux 继续保持活跃：Android 上的“随身 Linux 环境”仍在进化

Termux（Android 终端 + Linux 环境）项目仍然非常活跃：插件生态（API/Boot/Widget/Tasker 等）完善，安装渠道也更强调“同源签名/不要混装”。对移动端开发、应急排障、轻量自动化来说依然很实用。

📎 原文链接：https://github.com/termux/termux-app

趣闻 / 安全

Moltbook（AI 社交网络）被曝 Supabase 配置问题：可读写敏感数据、泄露大量 token

Wiz 的安全研究披露：Moltbook 在前端 bundle 中暴露了 Supabase key，且后端缺少/错误配置 RLS（Row Level Security），导致未认证也能读取/写入生产数据。披露内容包括：

大量 API token/认证凭据
邮箱等身份数据
agent 私信数据（甚至出现明文第三方 API key）
以及“写权限”带来的内容篡改/注入风险

这类事件对“vibe coding/快速搭建”生态是一次很典型的警示：默认安全配置和最小权限必须是起点，而不是上线后的补丁。

📎 原文链接：https://www.wiz.io/blog/exposed-moltbook-database-reveals-millions-of-api-keys

假冒三星 990 Pro SSD：系统信息看起来“全对”，但性能暴露了马脚

Tom’s Hardware 报道了一个高仿案例：Windows/CrystalDiskInfo 识别出的型号、容量、甚至固件版本都“像真的”，但细节上出现异常（例如只跑在 PCIe 3.0），最终性能表现甚至可能接近 USB 2.0 水平。

对于买硬盘的建议也很现实：

价格低到离谱就当作风险信号
尽量走可信渠道并保留开箱证据
有官方鉴别软件的（如三星）第一时间跑认证

📎 原文链接：https://www.tomshardware.com/pc-components/ssds/fake-samsung-990-pro-passes-basic-checks-but-runs-slower-than-a-usb-2-0-drive-counterfeit-ssds-proliferate-as-nand-shortage-creates-the-perfect-storm-for-bogus-deals

本文汇总自 Hacker News 等社区信息源，每日更新，涵盖 AI 应用、游戏技术、开发工具及科技行业动态。

AI 与机器学习

The Hot Mess of AI：模型越“会想”，失败越像“随机事故”

Anthropic 的一篇研究把大模型失败拆成经典的 bias/variance（偏差/方差）：

Bias（偏差）：稳定但错（更像“系统性追错目标”）
Variance（方差）：不稳定、前后不一致（更像“热锅上的蚂蚁/一团糟”）

Longer reasoning → More incoherence. 复杂任务上，扩大模型规模也不一定带来更强一致性。

📎 原文链接：https://alignment.anthropic.com/2026/hot-mess-of-ai/

Nano-vLLM：用 1200 行 Python 拆解推理引擎的关键机制

如果你在做自托管推理或多租户 LLM 服务，文章非常适合用来对齐概念：

为啥吞吐/延迟是根本 trade-off
为啥 KV cache 是容量瓶颈
为啥前缀缓存能把“系统提示词”场景拉满

📎 原文链接：https://neutree.ai/blog/nano-vllm-part-1

开发工具与开源

OpenAI 推出 Codex App：面向“多代理并行开发”的指挥中心

OpenAI 发布了 macOS 的 Codex App，定位更像是一个“agent command center”：

多线程/多项目同时跑 agent，适合长任务并行
支持 diff 审阅、评论、在编辑器中打开
内建 worktrees，降低多个 agent 同 repo 冲突
提到 skills/automations：把重复流程变成可复用能力

对团队来说，这类产品的关键不只是“能写代码”，而是把监督、并行、隔离、审阅的流程做顺。

📎 原文链接：https://openai.com/index/introducing-the-codex-app/

Zig Devlog：推进 zig libc，减少冗余 C 代码、提升编译与体积表现

更少第三方依赖、更强自洽
编译更快、安装体积更小
静态链接的应用二进制更小
以及更激进的设想：跨 libc 边界做类似 LTO 的优化空间

📎 原文链接：https://ziglang.org/devlog/2026/#2026-01-31

基础设施与行业

GitHub Actions 发生退化/部分故障：影响依赖 Actions 的功能链路

对 CI/CD 强依赖团队来说，这类事件的常见应对包括：

关键 pipeline 的降级路径（例如自托管 runner 或镜像构建兜底）
针对上游中断的重试/回放策略
以及把“外部依赖不可用”当作常态来设计

📎 原文链接：https://www.githubstatus.com

游戏与怀旧科技

逆向 40 年前的并口加密狗：4 字节补丁“解锁”上古软件

关键点在于：

程序通过并口 I/O 指令和加密狗交互，最终在 BX 寄存器里得到一个“魔法常量”
作者用反汇编定位到校验例程后，发现结果没有输入、应当是常量，于是直接用 MOV BX, 0x7606; RETF 这种四字节级别的小补丁绕过
更“爽”的是：编译器会把同一套校验逻辑复制进产物里——所以补丁过的编译器会产出同样“去狗”的可执行文件

这类文章很适合拿来提醒团队：安全机制如果只是在客户端做“常量校验”，最终一定会变成“可脚本化的开关”。

📎 原文链接：https://dmitrybrant.com/2026/02/01/defeating-a-40-year-old-copy-protection-dongle

开发工具与开源（补充）

Termux 继续保持活跃：Android 上的“随身 Linux 环境”仍在进化

📎 原文链接：https://github.com/termux/termux-app

趣闻 / 安全

Moltbook（AI 社交网络）被曝 Supabase 配置问题：可读写敏感数据、泄露大量 token

大量 API token/认证凭据
邮箱等身份数据
agent 私信数据（甚至出现明文第三方 API key）
以及“写权限”带来的内容篡改/注入风险

这类事件对“vibe coding/快速搭建”生态是一次很典型的警示：默认安全配置和最小权限必须是起点，而不是上线后的补丁。

📎 原文链接：https://www.wiz.io/blog/exposed-moltbook-database-reveals-millions-of-api-keys

假冒三星 990 Pro SSD：系统信息看起来“全对”，但性能暴露了马脚

对于买硬盘的建议也很现实：

价格低到离谱就当作风险信号
尽量走可信渠道并保留开箱证据
有官方鉴别软件的（如三星）第一时间跑认证

本文汇总自 Hacker News 等社区信息源，每日更新，涵盖 AI 应用、游戏技术、开发工具及科技行业动态。

2026-02-03

技术新闻

2026-02-02 科技圈新闻汇总

AI 与机器学习

Google 研究：智能体系统的扩展科学

Google Research 发布了一项关于 AI 智能体系统扩展性的重要研究。传统观点认为「更多智能体 = 更好性能」，但这项大规模评估（涵盖 180 种智能体配置）揭示了这一假设的局限性。

研究发现，简单的「增加智能体」方法往往会遇到性能天花板，甚至在特定任务属性不匹配时导致性能下降。研究团队提出了三个关键维度来定义「智能体任务」：

与外部环境的持续多步交互
在部分可观察条件下的迭代信息收集
基于环境反馈的自适应策略优化

这项研究为构建更高效的 AI 系统提供了定量化的扩展原则。

特性	Rust	Swift
默认内存模型	所有权转移（更快）	写时复制（更简单）
学习曲线	较陡峭	较平缓
语法风格	显式函数式	类 C 语法包装函数式特性

2026-02-03 科技圈新闻汇总

AI 与机器学习

The Hot Mess of AI：模型越“会想”，失败越像“随机事故”

Nano-vLLM：用 1200 行 Python 拆解推理引擎的关键机制

开发工具与开源

OpenAI 推出 Codex App：面向“多代理并行开发”的指挥中心

Zig Devlog：推进 zig libc，减少冗余 C 代码、提升编译与体积表现

基础设施与行业

GitHub Actions 发生退化/部分故障：影响依赖 Actions 的功能链路

游戏与怀旧科技

逆向 40 年前的并口加密狗：4 字节补丁“解锁”上古软件

开发工具与开源（补充）

Termux 继续保持活跃：Android 上的“随身 Linux 环境”仍在进化

趣闻 / 安全

Moltbook（AI 社交网络）被曝 Supabase 配置问题：可读写敏感数据、泄露大量 token

假冒三星 990 Pro SSD：系统信息看起来“全对”，但性能暴露了马脚

AI 与机器学习

The Hot Mess of AI：模型越“会想”，失败越像“随机事故”

Nano-vLLM：用 1200 行 Python 拆解推理引擎的关键机制

开发工具与开源

OpenAI 推出 Codex App：面向“多代理并行开发”的指挥中心

Zig Devlog：推进 zig libc，减少冗余 C 代码、提升编译与体积表现

基础设施与行业

GitHub Actions 发生退化/部分故障：影响依赖 Actions 的功能链路

游戏与怀旧科技

逆向 40 年前的并口加密狗：4 字节补丁“解锁”上古软件

开发工具与开源（补充）

Termux 继续保持活跃：Android 上的“随身 Linux 环境”仍在进化

趣闻 / 安全

Moltbook（AI 社交网络）被曝 Supabase 配置问题：可读写敏感数据、泄露大量 token

假冒三星 990 Pro SSD：系统信息看起来“全对”，但性能暴露了马脚

2026-02-02 科技圈新闻汇总

AI 与机器学习

Google 研究：智能体系统的扩展科学

开发工具与开源

NetBird：开源零信任网络解决方案

VisualJJ：VS Code 中的 Jujutsu 版本控制

NanoClaw：500 行 TypeScript 实现的容器化 AI 助手

游戏与怀旧科技

Adventure Game Studio：开源冒险游戏制作工具

1976 年 Apple I 原版广告

Amiga Unix (Amix) 考古

基础设施与性能

CedarDB：现代数据库的高效字符串压缩

通过 Thunderbolt 实现可靠的 25G 以太网

安全

Moltbot 严重安全漏洞：一键 RCE 可窃取数据

趣闻

破解 40 年前的硬件加密狗

「我教会了邻居把音量调小」

列举动物直到失败

AI 与机器学习

Google 研究：智能体系统的扩展科学

开发工具与开源

NetBird：开源零信任网络解决方案

VisualJJ：VS Code 中的 Jujutsu 版本控制

NanoClaw：500 行 TypeScript 实现的容器化 AI 助手

游戏与怀旧科技

Adventure Game Studio：开源冒险游戏制作工具

1976 年 Apple I 原版广告

Amiga Unix (Amix) 考古

基础设施与性能

CedarDB：现代数据库的高效字符串压缩

通过 Thunderbolt 实现可靠的 25G 以太网

安全

Moltbot 严重安全漏洞：一键 RCE 可窃取数据

趣闻

破解 40 年前的硬件加密狗

「我教会了邻居把音量调小」

列举动物直到失败

2026-02-01 科技圈新闻汇总

🤖 AI 与机器学习

Wiki Education 发布 AI 编辑 Wikipedia 研究报告

自动驾驶汽车和无人机对路标提示注入攻击反应令人担忧

🎮 游戏与怀旧科技

为 Nintendo DS 打造的代码编辑器与 3D 游戏引擎

NASA 的 WB-57 飞机在休斯顿迫降

🛠️ 开发工具与开源

Swift 是更便捷的 Rust？

开源社区驱动的强化容器镜像 Minimal 发布