【HN中文日报】白内障手术、Meta吃官司、无人机撞吊车...今天科技圈大事件都在这儿了！

今天 Hacker News 社区聊了啥？ NO.20251002

这期日报信息量爆炸！从白内障手术的历史演变到Meta因侵犯用户选择权被判败诉，再到亚马逊无人机坠毁事故，带你速览全球科技热点。更有深度解读：如何用Megakernel优化GPU，提升Llama-70B推理速度；以及对RAG架构未来命运的预测。想知道AI如何助力Curl发现bug？JetBrains又在PHP开源领域搞什么大动作？别犹豫了，赶紧点进来，一次性掌握最新科技动态，让你不再错过任何精彩内容！

Hacker News 中文精选

白内障手术：全球最常见的手术及其历史演变

本文探讨了白内障这一眼科疾病，以及治疗白内障的常见手术。文章不仅介绍了现代白内障手术的进展和可负担性，还追溯了古代的治疗方法，揭示了医学技术的演变和全球健康挑战。

白内障是由于眼球晶状体混浊引起的，如果不加以治疗，可能导致失明。现代医学中，白内障手术是世界上最常见的手术，每年全球进行超过2000万例，超过了心脏支架、髋关节置换和阑尾切除术。虽然白内障手术相对便宜，在美国大约需要6000美元，而在坦桑尼亚等国家可能低至150美元，但因白内障导致的视力丧失仍然是全球失明的主要原因，尤其是在低收入国家。

文章还回顾了白内障手术的历史。 “白内障”一词源于拉丁语和古希腊语，意为“瀑布”，形象地描述了混浊的晶状体。早在公元前600年，印度医生Maharshi Sushruta就在其著作《Sushruta Samhita》中首次详细描述了一种称为“Couching”的白内障治疗方法。这种方法使用弯曲的针将混浊的晶状体推入玻璃体腔，使其离开瞳孔，从而暂时恢复部分视力。虽然这种方法与现代手术相比非常原始，但在当时已经非常精细。

Sushruta强调了卫生、时机和患者准备的重要性，建议只在有利的季节、禁食后进行手术。术后护理包括避免咳嗽、打喷嚏和用力排便等活动，以防止眼部压力增加。尽管现代白内障手术技术已经非常成熟，成功率超过95%，但更广泛的普及和可及性仍然是重要的挑战。

总的来说，这篇文章深入探讨了白内障手术的各个方面，从现代医学的进步到古代的治疗方法，再到全球健康挑战。它提醒我们，医学的进步不仅仅在于技术的创新，还在于如何让更多的人能够获得这些进步带来的好处。

原文: The most common surgery
Hacker News: https://news.ycombinator.com/item?id=45414718
作者: mailyk
评分: 61
评论数: 29
发布时间: 2025-09-29 23:04:07

使用 Megakernel 优化 GPU 资源，提升 Llama-70B 推理吞吐量

本文介绍了如何使用 throughput-optimized megakernel 在 H100 GPU 上进行 Llama-70B 张量并行推理，通过计算、内存和通信操作的重叠，充分利用 GPU 上的硬件资源。

文章的核心在于解决大型语言模型（LLM）推理过程中 GPU 资源利用率不足的问题。传统的推理方法将模型拆分成多个小 kernel，导致频繁的 kernel 启动和停止，产生大量的开销，造成 GPU 资源的浪费。为了解决这个问题，作者提出了 Megakernel 的概念，将整个模型的前向传播过程融合到一个大的 kernel 中，从而减少 kernel 切换的开销，提高 GPU 的利用率。

Megakernel 的核心思想是指令和解释器模型。指令将模型前向传播分解为细粒度的操作，每个指令包含加载、计算和存储等部分。解释器在 GPU 上执行这些指令，并能够跨指令边界进行流水线操作，从而实现计算、内存和通信的重叠。

文章详细介绍了如何将张量并行 Llama 前向传播映射到 Megakernel 中，包括一种新颖的方法，用于在运行 attention 后立即跨 GPU 传输中间结果。这种新操作需要复杂的多 GPU 转置，使用标准通信模式无法有效表达，但在 Megakernel 中实现起来非常简单。

通过在 SM 内部、SM 之间以及 GPU 之间实现细粒度的资源重叠，Megakernel 能够充分利用 GPU 的计算、内存和通信资源。在 SM 内部，指令间的流水线操作可以重叠内存移动和计算，保持 tensor core 的运行。在 SM 之间，仔细调度指令可以同时重叠计算密集型和内存密集型任务。在 GPU 之间，可以将通信成本隐藏在特殊的 "storer" 线程中，让其他线程可以自由地处理下一个指令。

实验结果表明，与 vLLM 和 SGLang 相比，Megakernel 能够显著提高 Llama-70B 的推理吞吐量，在端到端吞吐量上优于 SGLang 超过 22%（通过完成 ShareGPT 基准测试中的 65,536 个 prompt 的时间来衡量）。

文章还提到，尽管低延迟和高吞吐量工作负载之间存在显著差异，但核心 Megakernel 抽象（在每个 SM 上运行的流水线指令解释器）在这两个领域都具有高度的可移植性。

由于没有评论内容，此处省略评论分析。

原文: We bought the whole GPU, so we're damn well going to use the whole GPU
Hacker News: https://news.ycombinator.com/item?id=45407953
作者: sydriax
评分: 220
评论数: 32
发布时间: 2025-09-29 05:00:18

Meta 败诉：用户选择权必须得到尊重

荷兰数字人权组织 Bits of Freedom 状告 Meta 违反《数字服务法》(DSA) 胜诉，法官裁定 Meta 必须尊重用户在 Instagram 和 Facebook 等应用上选择非个性化推荐信息流的权利。

DSA 旨在赋予用户对大型在线平台更大的自主权和控制权。判决指出，Meta 目前的做法违背了 DSA 的宗旨，即赋予用户真正的自主权、选择自由以及对信息呈现方式的控制权。法官认为 Meta 平台的设计严重扰乱了 Facebook 和 Instagram 用户的自主权，并责令 Meta 调整其应用，确保用户的选择得到保留，即使在用户导航到其他部分或重启应用时也是如此。Meta 有兴趣引导用户使用可以展示更多基于兴趣和行为的广告的信息流，这是 Meta 收入模式的核心。微妙的设计技巧将用户推向该信息流，而非个性化推荐的信息流则隐藏在一个logo后面，难以找到。选择替代时间线的用户还会失去对“直接消息”等功能的直接访问权限。

评论区里，大家对此判决各抒己见：

有人认为应该直接取缔广告模式，强制推行订阅制，让用户明白“免费”的代价是个人数据。
有人希望 YouTube 也能默认显示订阅内容。
还有人分享了自己转向邮件和聊天进行社交连接的经验，认为效果更好。
一些人希望社交平台能将消息功能独立出来，避免沉迷于信息流。
一位欧洲用户表示，很高兴看到大公司的影响力受到制约，期待信息流摆脱小报、政治和俄罗斯宣传，回归技术和动物。
当然，也有人认为这是政府过度干预，社交应用并非关键基础设施，用户有自由选择使用哪个平台的权利。
另有人提议，所有用户应该看到相同的信息，以相同的顺序排列，并带有相同的元数据，例如点赞和评论，以打破信息茧房，从而更容易强制执行公平报告、非法内容或操纵。
有评论员贴出了荷兰语的判决书链接，并指出 Meta 必须在两周内更改其平台，否则将面临每天 10 万欧元的罚款，最高可达 500 万欧元。

原文: NL Judge: Meta must respect user's choice of recommendation system
Hacker News: https://news.ycombinator.com/item?id=45448326
作者: mattashii
评分: 185
评论数: 142
发布时间: 2025-10-02 19:32:19

亚马逊无人机在亚利桑那州坠毁事故

今天我们来聊聊亚马逊无人机在亚利桑那州托勒森市发生的坠毁事故。据报道，两架亚马逊送货无人机在商业区撞上了一台起重机，目前托勒森警察局正在对此事进行调查。

具体来说，事故发生在星期三早上，但文章并没有详细说明事故发生的原因，也没有提及是否有人因此受伤。文章发布于 2025 年 10 月 1 日，由 abc15.com 的工作人员撰写。虽然信息相对简短，但引发了人们对于无人机送货安全性的关注。这起事故无疑给无人机送货的未来发展蒙上了一层阴影，也让人们开始重新审视无人机技术的安全性和可靠性。考虑到无人机在城市环境中飞行的复杂性，如何确保无人机能够安全避开障碍物，避免类似事故再次发生，是亚马逊以及整个无人机行业需要认真思考的问题。此外，事故责任的认定以及后续的赔偿问题，也将成为关注的焦点。

原文: Two Amazon delivery drones crash into crane in commercial area of Tolleson, AZ
Hacker News: https://news.ycombinator.com/item?id=45450449
作者: bookofjoe
评分: 12
评论数: 0
发布时间: 2025-10-02 22:52:49

Windows 10 停止支持：一场潜在的电子垃圾和安全危机

这篇文章探讨了 Windows 10 停止支持可能带来的严重问题，包括大量电子垃圾的产生和数百万用户面临的安全风险。文章呼吁微软延长对 Windows 10 的免费支持，以避免潜在的环境和安全灾难。

文章指出，由于 Windows 10 的广泛使用和 Windows 11 严格的硬件要求，预计将有高达 4 亿台电脑无法升级，从而产生大量的电子垃圾。这些电子垃圾不仅会加剧环境污染，还会浪费制造电脑所需的关键矿物资源。更令人担忧的是，停止安全更新将使数百万用户面临网络攻击的风险，因为黑客可以利用未修补的漏洞。文章引用安全专家的观点，强调了大量未修补设备将成为恶意攻击者的首选目标。

此外，文章还回顾了微软最初承诺为 Windows 10 提供持续免费更新的承诺，并批评了现在要求用户付费才能获得安全更新的做法。文章认为，微软应该延长对 Windows 10 的免费支持，以确保用户的安全，并为可持续发展做出贡献。文章最后呼吁用户签署请愿书，敦促微软改变其决定。总之，文章强调了 Windows 10 停止支持的潜在危害，并呼吁微软承担起社会责任，提供免费的安全更新。

评论区中，有用户指出 Windows 10 的用户占比仍然很高，这使得停止支持的影响更加广泛。

原文: Why the end of support for Windows 10 is uniquely troubling
Hacker News: https://news.ycombinator.com/item?id=45450194
作者: rntn
评分: 27
评论数: 17
发布时间: 2025-10-02 22:36:25

Red Hat 确认 GitHub 遭到入侵的安全事件

Red Hat 官方证实，他们的 GitHub 存储库遭遇安全事件，起因是有黑客声称成功入侵。目前，Red Hat 正在积极调查此事，以评估事件的影响范围和潜在风险。

根据 Red Hat 的声明，他们已经采取了紧急措施来控制局势，包括审查受影响的系统和加强安全措施。虽然具体细节尚未完全披露，但初步迹象表明，攻击者可能获得了对部分代码仓库的访问权限。这意味着可能存在代码泄露或被篡改的风险，这对于依赖 Red Hat 产品的用户来说，无疑是一个值得关注的问题。

Red Hat 强调，他们将透明地分享调查结果，并与社区合作，确保所有用户的数据和系统安全。同时，他们也建议用户密切关注官方发布的公告，并采取必要的预防措施，例如定期检查代码完整性，以及更新安全补丁。

这次事件再次提醒我们，即使是安全措施严密的大型科技公司，也无法完全避免安全风险。对于开发者和科技爱好者来说，保持警惕，及时了解最新的安全动态，并采取积极的防御措施，至关重要。

原文: Red Hat confirms security incident after hackers claim GitHub breach
Hacker News: https://news.ycombinator.com/item?id=45448772
作者: speckx
评分: 68
评论数: 17
发布时间: 2025-10-02 20:28:27

Minecraft 红石版 ChatGPT：技术爱好者的狂欢

这个视频展示了作者使用 Minecraft 红石电路构建了一个小型语言模型，实现了类似 ChatGPT 的功能，令人叹为观止。

作者没有使用任何命令方块或数据包，完全依靠红石电路实现了这一壮举。这个模型拥有 5,087,280 个参数，并在 Python 中使用 TinyChat 数据集进行了训练。视频详细介绍了从 Tokenizer（分词器）到 Transformer 模型的构建过程，展示了如何在 Minecraft 中实现神经网络的基本原理。这不仅仅是一个简单的红石作品，更是一个对 AI 原理的深刻理解和创造性应用。视频中，作者一步步地讲解了如何用红石电路模拟神经元、权重和激活函数，最终构建出一个可以进行简单对话的 AI 系统。

评论区里，大家纷纷表示震惊和敬佩，有人说“我不知道该说什么了”，有人调侃“想象一下发现自己是个 Minecraft 建筑的恐怖感”，还有人表示这应该直接写在简历上。很多人一开始以为只是简单的调用 API，但看到作者后就知道事情不简单。还有人指出，这个模型虽然参数量远小于 GPT-1 和 GPT-3，但能在 Minecraft 中实现已经非常了不起。

评论区也充满了技术讨论，有人对红石电路的实现细节感兴趣，有人则对模型的大小和训练方式提出了疑问。总体来说，评论区对作者的创造力和技术实力表示了高度认可，同时也激发了大家对 Minecraft 和 AI 结合的更多可能性。

原文: I built ChatGPT with Minecraft redstone [video]
Hacker News: https://news.ycombinator.com/item?id=45410068
作者: ghuntley
评分: 264
评论数: 56
发布时间: 2025-09-29 11:22:27

欧盟资金流入间谍软件公司引发政治问责呼声

欧盟议员们正在呼吁对欧盟委员会向间谍软件公司提供资金的行为进行解释，事件被专家称为可能引发欧洲版的“水门事件”。文章指出，欧盟资金被用于资助间谍软件公司，这引起了人们对隐私和安全的严重担忧。

具体来说，文章揭露了欧盟委员会可能存在滥用资金的情况，这些资金本应用于其他目的，却流入了间谍软件公司的口袋。议员们要求彻查此事，并追究相关责任人的责任。文章强调，这种行为不仅损害了欧盟的声誉，也对公民的权利构成了威胁。欧盟委员会需要公开透明地回应这些指控，并采取措施防止类似事件再次发生。文章还提到，专家们认为，如果欧盟不采取果断行动，可能会面临严重的政治危机。

原文: EU funds are flowing into spyware companies and politicians demanding answers
Hacker News: https://news.ycombinator.com/item?id=45448825
作者: Bender
评分: 80
评论数: 38
发布时间: 2025-10-02 20:34:43

面向未来的开源数据文件格式：F3

本文介绍了一种名为 F3 (Future-proof File Format) 的新型开源数据文件格式，旨在解决现有格式（如 Parquet 和 ORC）在现代数据分析环境中存在的互操作性、可扩展性和效率问题。

F3 的核心设计原则是互操作性、可扩展性和效率。它通过提供数据组织结构和通用 API，允许开发者轻松添加新的编码方案，从而避免了每次数据处理和计算发生变化时都需要创建新格式的问题。每个 F3 文件都包含数据、元数据以及用于解码数据的 WebAssembly (Wasm) 二进制文件。将解码器嵌入到每个文件中所需的存储空间极小（千字节），并确保在任何平台上都具有兼容性，以防原生解码器不可用。

F3 通过分离 I/O、编码和字典单元，改进了现有格式的布局问题，并结合了级联压缩和向量化解码等先进方法。最关键的设计在于其互操作性，F3 公开了一个 API，定义了如何解码文件中的压缩数据，并将编码方法视为可独立安装和升级的插件。为了确保任何库版本都可以读取任何文件，F3 将解码器实现作为 WebAssembly (Wasm) 二进制文件嵌入到文件中。

文章将 F3 与传统和最先进的开源文件格式进行了比较，结果表明 F3 的存储布局和 Wasm 驱动的解码具有显著优势。F3 的目标是成为下一代数据分析系统的基础，提供更高效、更灵活和更具互操作性的数据存储和访问解决方案。它试图通过内嵌解码器的方式，解决不同平台和库版本之间的兼容性问题，从而保证数据的长期可用性。该格式的设计理念是面向未来，旨在适应不断变化的硬件和工作负载环境，避免重蹈现有格式的覆辙。

原文: F3: Open-source data file format for the future [pdf]
Hacker News: https://news.ycombinator.com/item?id=45437759
作者: eatonphil
评分: 294
评论数: 98
发布时间: 2025-10-01 21:52:41

Gmail 将不再支持通过 POP 协议从第三方账户收取邮件

Gmail 停止支持通过 POP 协议从其他邮箱账户收取邮件，这意味着用户将无法再使用 Gmail 集中管理来自不同邮箱的邮件。这项变更影响了依赖 POP3 协议将其他邮箱邮件导入 Gmail 的用户，促使他们寻找替代方案。

文章指出，Gmail 停止支持 POP 协议的“pull”方式，即 Gmail 主动从其他邮箱服务器拉取邮件。建议用户配置其他邮箱服务器，将邮件“push”到 Gmail 邮箱，也就是设置邮件转发。如果用户使用的是 Gmail 应用，也可以直接在应用中配置其他邮箱账户，通过 IMAP 协议访问。但需要注意的是，通过转发方式接收的邮件会全部进入 Gmail 账户，而不会像之前那样区分不同的邮箱账户。有用户认为，Gmail 这么做是为了推广 Google Workspace 付费服务，鼓励用户为更全面的邮件服务付费。

评论区里，大家对此事议论纷纷，观点各异。一些用户对此表示不满，认为 Gmail 在逐步“变坏”，并开始考虑转向其他邮件服务，例如 ProtonMail。也有用户指出，Gmail 停止的是“pull”邮件的方式，建议通过设置邮件转发来解决问题。还有人认为，此举可能是 Google 为了推广其付费服务，希望用户为更全面的邮件功能付费。也有用户提到，之前使用 POP3 协议从其他邮箱收取邮件到 Gmail，现在不得不重新设置。另有用户指出文章描述不清，容易产生歧义。

原文: Gmail will no longer support checking emails from third-party accounts via POP
Hacker News: https://news.ycombinator.com/item?id=45439670
作者: sumanep
评分: 520
评论数: 274
发布时间: 2025-10-02 00:25:58

Activeloop 招聘 AI 搜索工程师和后端工程师

Activeloop 正在招募 AI 搜索工程师和后端工程师，这是一个加入快速发展的 AI 公司的绝佳机会。如果你对 AI 搜索技术充满热情，或者在后端开发方面经验丰富，那么 Activeloop 绝对值得考虑。

具体来说，AI 搜索工程师需要负责构建和优化 AI 驱动的搜索系统，这涉及到机器学习模型的训练、评估和部署，以及大规模数据处理和索引。后端工程师则专注于构建和维护 Activeloop 的后端基础设施，确保系统的稳定性、可扩展性和高性能。这两个职位都要求具备扎实的编程基础和解决问题的能力。

Activeloop 是一家 YC S18 的公司，这意味着它经过了 Y Combinator 的孵化，具有很强的创新能力和发展潜力。加入这样的公司，你将有机会参与到前沿技术的研发中，与优秀的团队成员一起成长。如果你正在寻找一个能够充分发挥你的技术才能的平台，Activeloop 绝对是一个不错的选择。

目前没有评论，无法进行评论分析。

原文: Activeloop (YC S18) Is Hiring AI Search Engineer and MTS(Back End)
Hacker News: https://news.ycombinator.com/item?id=45448539
作者: davidbuniat
评分: 1
评论数: 0
发布时间: 2025-10-02 20:00:33

JetBrains 推动 PHP 开源发展的新举措

JetBrains 通过赞助和支持开源项目，积极推动 PHP 社区的发展。本文介绍了 JetBrains 在 2025-2026 年赞助开源项目的新策略和具体行动，旨在进一步提升 PHP 生态系统的活力。

JetBrains 一直致力于通过多种方式支持 PHP 社区，包括开发优秀的 PHP 集成开发环境 PhpStorm，支持 PHP 基金会，组织 PHPverse 活动，以及将 Laravel Idea 插件免费提供给所有开发者。除了这些举措，JetBrains 还通过提供免费的 PhpStorm 许可证和资金赞助来支持有潜力的开源项目。

从 2025 年起，JetBrains 计划每年赞助大约五个开源项目和维护者，并且每年都会选择新的项目以实现支持的多样化。今年获得赞助的包括：Saif Eddin Gmati，他正在使用 Rust 构建 PHP 的新型静态分析器 Mago；Markus Staab，他参与了 PHPStan、Rector 和 PHPUnit 等多个开源项目；Kyrian Obikwelu，他积极探索 PHP 中 AI 和 MCP 的可能性；Sjon Hortensius，他负责维护 PHP 在线 shell 3v4l.org。目前还有一个赞助名额空缺，JetBrains 鼓励大家推荐合适的项目或个人。

JetBrains 的目标是通过这些赞助活动，支持那些能够对 PHP 社区产生积极影响的项目，并帮助他们实现更大的发展。他们相信，通过共同努力，可以进一步提升 PHP 生态系统的质量和创新能力。

)

原文: Moving PHP open source forward
Hacker News: https://news.ycombinator.com/item?id=45449125
作者: mikece
评分: 49
评论数: 31
发布时间: 2025-10-02 21:06:12

AI 助力 Curl 发现并修复 22 个 Bug

Daniel Stenberg 在 Mastodon 上分享了 Joshua Rogers 使用 AI 工具在 Curl 中发现大量潜在问题的消息，目前已修复 22 个 bug，还有更多问题待处理。这些问题主要是一些代码分析风格的细微之处，但其中可能包含一两个真正的安全漏洞。

Joshua Rogers 使用 AI 辅助工具对 Curl 进行了深入的代码分析，发现了一系列潜在问题。这些问题涵盖了代码风格、潜在 bug 和可能的安全隐患。Daniel Stenberg 对此表示赞赏，并已着手修复这些问题。目前已经修复了 22 个 bug，并计划继续处理剩余的问题。其中一个例子是 AI 发现 nread == 0 时被错误地视为读取了一个字节。

Daniel 还分享了一个 AI 工具分析 Curl Telnet 代码的例子，展示了 AI 如何理解底层协议的细节，并发现潜在的问题。Joshua Rogers 在他的博客文章中详细介绍了他的工作，包括他使用的 AI 工具和方法。

评论区里，大家对 AI 在代码分析中的应用表示了浓厚的兴趣。有人认为，这展示了 компетентные 人类如何利用 AI 工具提升工作效率。另一些人则担心过度依赖 AI，而忽略了学习基础知识的重要性。还有人对 AI 能够理解底层协议的细节感到惊讶，认为这是一个重要的突破。有人指出示例代码片段不准确，但作者确认描述是准确的。总的来说，大家对 AI 在代码分析领域的潜力持乐观态度，但也强调了人类专家监督的重要性。

原文: Daniel Stenberg on 22 curl bugs found by AI and fixed
Hacker News: https://news.ycombinator.com/item?id=45449348
作者: robhlam
评分: 25
评论数: 4
发布时间: 2025-10-02 21:29:55

阿根廷体育盗版网站运营者出狱后被科技独角兽公司聘用

这篇文章讲述了一位名为 Alejo Warles 的阿根廷人，运营体育盗版网站 Al Ángulo TV 被捕入狱，随后又被一家名为 9z Globant 的科技独角兽公司聘用的故事。Warles 的经历颇具戏剧性，引发了人们对于网络盗版、个人能力以及企业用人标准的讨论。

文章详细介绍了 Warles 被捕的经过，包括 LaLiga（西班牙足球联赛）的协助，以及 Warles 被关押期间的经历。令人惊讶的是，Warles 在被捕后反而获得了更多的关注，他的社交媒体账号粉丝数量不降反升。更令人意想不到的是，他出狱后不久就被 9z Globant 聘用，负责社交媒体运营。9z Globant 是一家由电竞团队 9z Team 和阿根廷科技独角兽 Globant 合作成立的公司，而 Globant 此前还曾与 LaLiga 合作监测直播用户体验，这使得 Warles 的入职更具讽刺意味。公司方面表示，他们看重的是 Warles 的能力，相信他能为团队带来价值。Warles 本人也对自己的新工作充满信心，自称是“偶像”、“天才”和“GOAT”（Greatest of All Time）。

评论区对这一事件也表达了不同的看法。有人指出，LaLiga 在打击盗版方面一直非常积极，甚至采取了一些有争议的手段，例如要求西班牙 ISP 封锁 IP 地址。也有人认为，只要 Warles 能够编写出色的代码，并且不在公司资源上从事非法活动，那么他过去的经历不应该成为阻碍他发展的因素。还有人认为，9z Globant 聘用 Warles 是一个明智之举，因为他拥有运营视频直播平台的经验和才能，这对于该公司拓展电竞业务非常有帮助。总的来说，评论区的观点呈现出多样化的视角，既有对盗版行为的谴责，也有对个人能力和企业用人标准的思考。

原文: Piracy Operator Goes from Jail to Getting Hired by a Tech Unicorn in a Month
Hacker News: https://news.ycombinator.com/item?id=45448802
作者: askl
评分: 49
评论数: 23
发布时间: 2025-10-02 20:31:53

Immich v2.0.0 发布：首个稳定版本

Immich 是一款开源的照片和视频管理工具，近日发布了其首个稳定版本 v2.0.0。这个版本标志着 Immich 从早期开发阶段走向成熟，为用户提供更加稳定可靠的体验。

Immich 旨在提供一个用户友好的平台，用于存储、管理和分享个人照片和视频。作为一个自托管解决方案，Immich 允许用户完全掌控自己的数据，避免了对商业云服务的依赖。v2.0.0 版本的发布，意味着 Immich 在功能和性能上都达到了一个新的高度，可以满足更多用户的需求。

虽然文章内容较少，但我们可以推断，此版本可能包含以下关键改进：稳定性提升，修复了之前版本中存在的 bug，增强了应用的整体可靠性。性能优化，提升了照片和视频的上传、浏览和搜索速度，改善用户体验。功能完善，可能增加了新的功能，例如更强大的搜索功能、更灵活的相册管理、以及更便捷的分享选项。总而言之，v2.0.0 版本是 Immich 发展历程中的一个重要里程碑，预示着这款开源应用拥有更广阔的应用前景。

原文: Immich v2.0.0 – First stable release
Hacker News: https://news.ycombinator.com/item?id=45446834
作者: Alexvb
评分: 356
评论数: 98
发布时间: 2025-10-02 14:25:43

RAG 的挽歌：被 Agent 杀死，被上下文窗口埋葬

本文讨论了作者对检索增强生成 (RAG) 架构的看法，认为随着上下文窗口的扩大和 Agent 架构的成熟，RAG 架构正在走向衰落。作者基于其在 AI 和搜索领域十年的经验，以及在 Fintool 构建 RAG 系统的三年经验，提出了这一观点。

文章首先回顾了 RAG 出现的背景，即大型语言模型 (LLM) 的上下文窗口有限，无法处理大量知识库。RAG 通过检索最相关的文档片段并将其提供给 LLM 进行总结，解决了这个问题。然而，RAG 也存在一些问题，例如如何将长文档分割成合适的块，以及如何准确地搜索这些块。

文章详细讨论了文档分块的挑战。简单地按固定字数分割文档会导致关键信息分散在不同的块中，例如收入确认政策、风险因素解释、财务表格的标题和数据等。为了解决这个问题，Fintool 开发了复杂的分块策略，包括保持层级结构、维护表格完整性、保留交叉引用、保证时间一致性以及关联脚注。此外，每个块都富含元数据，例如文件类型、会计期间、章节层级、表格标识符、交叉引用映射、公司标识符和行业分类代码。

文章还讨论了向量搜索的问题。虽然向量搜索在理论上很优雅，但在实践中却存在很多问题。嵌入模型在通用文本上训练，难以处理特定的术语。它们可以找到相似性，但无法区分“收入确认”和“收入增长”。为了解决这个问题，Fintool 构建了一个混合搜索系统，将语义搜索 (嵌入) 与传统的关键词搜索 (BM25) 相结合。BM25 擅长精确匹配，可以更好地处理罕见术语，并对文档长度进行归一化。Fintool 的混合搜索系统采用并行处理、动态加权和分数归一化等技术，以提高检索的准确性。

总而言之，作者认为，尽管 RAG 在过去几年中发挥了重要作用，但其局限性也日益明显。随着上下文窗口的扩大和 Agent 架构的成熟，RAG 可能会被更先进的技术所取代。

原文: The RAG Obituary: Killed by agents, buried by context windows
Hacker News: https://news.ycombinator.com/item?id=45439997
作者: nbstme
评分: 224
评论数: 146
发布时间: 2025-10-02 00:51:58

自建数据中心：30PB 硬盘的堆叠之旅

本文讲述了某公司为了预训练模型，自建数据中心存储 30PB 视频数据的过程，详细对比了自建与 AWS、Cloudflare 等云存储方案的成本，最终选择了在旧金山市中心租用空间，通过“硬盘堆叠派对”的方式快速搭建起存储集群，将成本大幅降低。

文章提到，他们的数据使用场景对数据冗余和可用性要求不高，可以容忍一定程度的数据损坏，这与传统企业对数据可靠性的需求不同。因此，他们不需要 AWS 那样 13 个 9 的可靠性，2 个 9 就足够了。同时，云存储的定价通常高于成本，对于需要大量存储的公司来说，自建数据中心可以显著降低成本。他们与 Internet Archive 的工程师交流后发现，即使有 AWS 的友情价，自建机房的成本效益仍然高出 10 倍。

成本分析是文章的重点。他们对比了 AWS、Cloudflare R2 和自建数据中心的月度成本。AWS 的成本包括存储和出口流量费用，总计高达 113 万美元/月；Cloudflare R2 的预估价格为 27 万美元/月；而自建数据中心的总成本（包括 recurring 费用和折旧）仅为 2.95 万美元/月。具体而言，自建数据中心的月度经常性成本包括互联网和电力，一次性成本包括硬盘、存储基础设施、计算节点、数据中心设置费、人工和网络设备等。通过计算，自建数据中心的成本为 1 美元/TB/月，远低于 AWS 的 38 美元/TB/月和 Cloudflare 的 10 美元/TB/月。

为了快速完成数据中心的搭建，他们举办了“存储堆叠星期六”（S3）活动，邀请朋友帮忙堆叠硬盘，并在 36 小时内完成了 30PB 硬件的安装和布线。文章还提到，他们曾因模型训练期间对 Cloudflare R2 服务器造成过大的负载而被限速，这促使他们更加坚定了自建数据中心的决心。

原文: Building the heap: racking 30 petabytes of hard drives for pretraining
Hacker News: https://news.ycombinator.com/item?id=45438496
作者: nee1r
评分: 376
评论数: 257
发布时间: 2025-10-01 23:00:41

Claude Code 的魔力：Unix 哲学与文件系统访问如何成就卓越

本文探讨了 Claude Code 的独特之处，以及它如何成为作者 Noah 强大的 AI 助手。文章指出，Claude Code 的核心优势在于它对 Unix 哲学的拥抱以及对文件系统的原生访问能力，这两者结合使其在众多 AI 工具中脱颖而出。

作者首先介绍了自己对 Claude Code 的依赖，并解释了为何它超越了其他工具，成为了他的“agentic operating system”。关键在于 Claude Code 遵循了 Unix 哲学，将复杂任务分解为一系列简单、可组合的工具。这些工具通过命令行界面进行交互，完美契合了 LLM 的工作方式，即通过“管道”将一个工具的输出作为另一个工具的输入。

此外，Claude Code 具备文件系统访问权限，这解决了 ChatGPT 和 Claude 等基于浏览器的 AI 工具的两个主要缺陷：缺乏对话间的记忆和受限的上下文窗口。通过读写文件，Claude Code 可以记录笔记、积累知识并保持运行状态，从而实现超越单次对话的思考。

作者还提到了“产品悬垂”的概念，即模型已经具备某种能力，但产品设计未能充分利用。Claude Code 通过文件系统访问，释放了模型中隐藏的潜力，使其能够构建更可靠的 agentic 系统。最后，作者分享了自己基于 Claude Code 构建的开源项目 Claudesidian，以及正在开发的“Inbox Magic”工具，展示了 Claude Code 在构建新型应用程序方面的潜力。

总而言之，Claude Code 的魔力在于它将 Unix 哲学的简洁性与文件系统访问的强大功能相结合，为 LLM 提供了一个理想的运行环境，使其能够更有效地完成各种任务。

原文: Unix philosophy and filesystem access makes Claude Code amazing
Hacker News: https://news.ycombinator.com/item?id=45437893
作者: noahbrier
评分: 365
评论数: 190
发布时间: 2025-10-01 22:05:45

Keyhive：本地优先的访问控制探索

Keyhive 项目旨在探索本地优先的访问控制，为安全协作提供坚实的基础，类似于私密聊天的保证，但适用于任何本地优先的应用程序。该项目通过实验和原型设计，分享在解决该问题和潜在解决方案方面的发现。

文章指出，随着本地优先生态系统的成熟，其应用场景也在不断扩展。本地优先强调协作，但对于个人使用和团队协作的应用，约束条件有所不同。数据的私密性是基本要求，例如策划惊喜派对、公司会议记录、书籍草稿和法律合同等应用。

目前常见的访问控制模式依赖于中央服务器。虽然云认证工具不断发展，但现有的云认证工具已经非常成熟。在没有云认证服务器的情况下进行访问控制，需要重新思考认证的底层机制。Keyhive 试图在本地优先的环境下实现安全高效的认证，同时保留 Google Docs、Dropbox、GitHub 和 Discord 等应用程序的用户体验。

文章还提到，本地优先应用程序通常依赖于“隐蔽性安全”，例如，默认情况下，任何知道 Automerge 文档 ID 的人都可以写入该文档。这种方式的安全性是all-or-nothing的，一旦文档 ID 泄露，文档就变成了世界可写的。

为了实现本地优先的访问控制，需要重新思考权限如何在节点之间流动。文章认为，理想的系统应该兼具 Rumpelstiltskin 的自我认证、认证服务器的能力以及去中心化解决方案的用户自主性。按照本地优先的定义，应用程序应该在任意长时间的断开连接后接受更新。将此要求扩展到访问控制意味着，撤销访问或进行更细粒度的控制（例如读与写）需要跟踪谁有权执行什么操作，以及在文档历史记录中的哪个时间点。

文章还强调，今天的云服务拥有非常成熟的访问控制功能，这些系统依赖于一个关键的架构细节：它们能够利用网络边界进行封装。由于客户端无法直接读取或写入数据，因此特权保护进程能够应用任意访问控制规则。此过程代表客户端检索和/或更改数据。

总而言之，Keyhive 旨在探索一种在本地优先环境中实现安全、高效且用户友好的访问控制方法，以满足下一代本地优先应用程序的需求。

原文: Keyhive – Local-first access control
Hacker News: https://news.ycombinator.com/item?id=45445114
作者: dannyobrien
评分: 138
评论数: 9
发布时间: 2025-10-02 08:12:35

工作不是学校：如何在职场中生存

这篇文章探讨了职场与学校的不同规则，以及如何在充满“机构性愚蠢”的环境中保持理智并取得成功。文章的核心观点是，职场并非纯粹的精英体制，而是受到心理、决策和利益竞争等多种因素影响。

文章首先指出，在学校里努力学习并取得好成绩是成功的关键，但在职场中，仅靠努力是不够的。组织并非完全基于能力或明确的标准运作，而是受到“机构性愚蠢”的影响。这种“愚蠢”并非恶意，而是由于人们需要兼顾太多事情、思考太少以及缺乏对现实的清晰认知造成的。因此，作者建议不要将职场中的问题归咎于恶意，而是应该尝试理解背后的原因，保持好奇心，并研究系统运作的方式。

文章还强调，组织并非精英体制，表现出色并不一定能得到应有的回报。权力关系、时机、认知和政治上的实用性等因素也会影响一个人的职业发展。因此，除了努力工作之外，还需要注重建立人脉、提高知名度，并有效地展示自己的价值。此外，文章还提到，在职场中，感知与表现同样重要。你需要积极地塑造自己的形象，并确保关键人物了解你的工作和价值。

文章还建议不要浪费时间去争取“客观公正”，而是应该学会理解隐藏在表面之下的主观逻辑。你需要了解决策者的信任对象、他们对战略和战术的看法，以及如何让他们相信你。最后，文章强调了定位的重要性，你需要找到合适的时机、合适的理由和合适的方式来展示你的贡献。

总而言之，这篇文章为那些在职场中感到困惑和沮丧的人提供了一些有用的建议，帮助他们更好地理解职场规则，并在“机构性愚蠢”的环境中生存和发展。

原文: Work Is Not School: Surviving Institutional Stupidity
Hacker News: https://news.ycombinator.com/item?id=45450525
作者: sherilm
评分: 3
评论数: 0
发布时间: 2025-10-02 22:58:04

Edge264：极简高性能的H.264/AVC视频软件解码器

Edge264 是一个极简的 H.264/AVC 视频格式软件解码器，旨在提供高性能。该项目目前还在开发中，计划在完成 GStreamer/VLC 插件后正式发布。

Edge264 支持 Progressive High 和 MVC 3D profiles，最高可达 level 6.2，支持高达 8K UHD 的分辨率，以及 8-bit 4:2:0 planar YUV 输出。它还支持 slices 和 Arbitrary Slice Order，以及 slice 和 frame 多线程处理，并具备 Per-slice reference picture list、Memory Management Control Operations 和 Long-term reference frames 等特性。

该解码器支持 Windows (x86, x64)、Linux (x86, x64, ARM64) 和 Mac OS (x64) 平台。Edge264 完全使用 C 语言开发，利用 128 位向量扩展和向量内在函数，可以使用 GNU GCC 或 LLVM Clang 进行编译。可选地，可以使用 SDL2 运行时库来启用 edge264_test 的显示功能。

编译时，可以通过 make 命令配置不同的选项，例如选择 C 编译器、编译标志、目标操作系统以及包含在库中的其他变体。例如，可以针对特定的 x86-64 微架构级别进行编译，以优化性能。

该项目还提供了一个自动化测试程序 edge264_test，可以浏览指定目录中的文件，解码每个 <video>.264 文件，并将其输出与每个同级文件 <video>.yuv 进行比较（如果找到）。在 AVCv1、FRExt 和 MVC 一致性码流集上，有 109/224 个文件可以无错误解码，其余文件使用了尚未支持的功能。

该项目还提供了一个完整的示例代码，演示了如何从命令行打开 Annex B 格式的输入文件，并将其解码后的帧以 planar YUV 顺序转储到标准输出。edge264_test.c 文件中提供了一个更完整的示例，该示例还可以显示帧。

Edge264 提供了 C 语言 API，包括用于查找起始码、分配和初始化解码上下文、解码单个 NAL 单元等函数。API 文档详细描述了每个函数的参数和返回值。

原文: Edge264 – Minimalist, high-performance software decoder for H.264/AVC video
Hacker News: https://news.ycombinator.com/item?id=45443462
作者: andsoitis
评分: 143
评论数: 31
发布时间: 2025-10-02 05:00:18

气候变暖而非过度放牧：对草原的最大威胁

一项研究表明，气候变化对草原的影响远大于过度放牧，这项研究基于对蒙古国40年数据的分析，挑战了长期以来认为过度放牧是草原退化的主要因素的观点。

这项研究由康奈尔大学的研究人员进行，他们分析了蒙古国41年的详细数据，发现虽然较大的畜群规模可能会略微降低草原的年度生产力，但天气和气候的影响要大得多。研究表明，长期来看，草原状况的变化完全归因于气候变化。研究人员使用了复杂的两阶段统计分析方法，结合牲畜普查数据和冬季特大暴风雪事件，来预测牧群规模的变化，并评估其对夏季草原生产力的影响。

研究结果表明，蒙古国的草原更多地受到全球温室气体排放行为的影响，而不是当地牧民的影响。因此，研究人员呼吁政策制定者将更多注意力放在全球减缓气候变化以及对气候损害的国际补偿上，而不是对温室气体排放贡献较小的国家的牧民征税。这项研究强调了气候变化对全球草原生态系统的重大影响，并强调了采取全球行动应对气候变化的必要性。这项研究发表在《科学》杂志上，为草原管理和政策制定提供了新的视角。

这项研究的主要作者Chris Barrett表示，蒙古草原受全球温室气体排放行为的影响，远大于当地牧民的影响。他呼吁政策制定者将更多注意力放在全球减缓气候变化以及对气候损害的国际补偿上，而不是对温室气体排放贡献较小的国家的牧民征税。这项研究结果对于理解草原生态系统的动态以及制定有效的管理策略具有重要意义。

原文: Warming climate–not overgrazing–is biggest threat to rangelands, study suggests
Hacker News: https://news.ycombinator.com/item?id=45448950
作者: PaulHoule
评分: 19
评论数: 10
发布时间: 2025-10-02 20:48:04

人形机器人灵巧性挑战：为何近期难以实现？

本文作者 Rodney Brooks 探讨了当前人形机器人难以掌握灵巧操作的原因，并分析了人形机器人领域存在的炒作现象。文章指出，尽管投入了大量资金，但人形机器人在灵巧性方面仍面临巨大挑战，短期内无法达到人类水平。

文章首先回顾了机器人操作的历史，从 1961 年 Heinrich Ernst 的早期工作到现代工业机器人，再到近年来备受关注的人形机器人。作者批评了人形机器人领域存在的炒作现象，特别是那些声称人形机器人将在短期内取代人类完成各种任务的观点。他认为，这种观点是“纯粹的幻想”，并指出人形机器人要真正实现通用性，必须在灵巧性方面达到人类水平。

文章随后简要介绍了人形机器人的发展历程，从早期的 WABOT 系列到 ASIMO、QRIO、NAO 和 ATLAS 等知名机器人。作者强调，尽管经过了几十年的发展，人形机器人在操作方面仍然面临着巨大的挑战。他指出，即使是简单的操作，如抓取和放置物体，对于人形机器人来说也是非常困难的。

作者认为，人形机器人难以实现灵巧操作的原因是多方面的，包括硬件方面的限制、软件算法的不足以及环境的复杂性。他特别强调了感知和控制的重要性，指出人形机器人需要能够准确地感知周围环境，并能够精确地控制自己的动作。此外，作者还指出，人形机器人需要具备一定的学习能力，才能适应不同的任务和环境。

总而言之，作者对人形机器人的近期发展持谨慎态度，认为在灵巧性方面取得突破性进展还需要很长时间。他呼吁业界保持理性，避免过度炒作，并专注于解决实际问题。

由于没有评论内容，这里跳过评论分析部分。

原文: Why today's humanoids won't learn dexterity
Hacker News: https://news.ycombinator.com/item?id=45392922
作者: chmaynard
评分: 185
评论数: 181
发布时间: 2025-09-27 10:53:24

2025 年 10 月招聘信息汇总：AI 与软件工程机会

这篇 "Ask HN: Who is hiring? (October 2025)" 帖子汇总了 2025 年 10 月份的招聘信息，主要集中在 AI、软件工程和相关技术领域。从中可以发现，不少公司都在积极招募人才，涵盖远程、混合和现场工作模式，地点遍布美国、欧洲等地。

具体来看，招聘岗位包括：ISRG 正在招聘远程的募款主管和助理主管；Tufalabs 在苏黎世寻找 COO 和高级研究工程师，专注于 AI 研究和 LLM 开发；Ageospatial 招募 AI 解决方案架构师，可以远程工作或在欧盟/瑞士工作；Intact Solutions 招聘软件工程师，需要有机械工程、计算物理或计算几何背景；Meilisearch 在巴黎招聘平台工程师和 Rust 软件工程师；Diffusely 在巴黎招聘后端 Python 工程师，从事 AI 媒体增强工作；Consigli 在伦敦招聘机器学习工程师、MLOps 工程师、LLM/NLP 工程师和前端工程师，致力于将 AI 应用于建筑工程和房地产项目；Matterworks.ai 招聘机器学习科学家和工程师，开发生物数据分析 AI 工具。

这些职位对技术栈的要求也各有侧重，例如 Agentic AI, Langchain, LangGraph, Distributed/Parallel computing, Memory management, Autoscaling, AWS, Kubernetes, Microservices, Django, Node, DuckDB, WASM, WebGL，以及 Rust, Python, Svelte/React 等。

评论区主要以公司和招聘者发布招聘信息为主，信息量大且集中，为求职者提供了丰富的机会。从中可以看出，AI 领域的人才需求依然旺盛，且对特定技术和行业背景有一定要求。同时，远程工作和混合工作模式也越来越普遍，为求职者提供了更多选择。

原文: Ask HN: Who is hiring? (October 2025)
Hacker News: https://news.ycombinator.com/item?id=45438503
作者: whoishiring
评分: 214
评论数: 291
发布时间: 2025-10-01 23:01:06