9天前
|
|
|
## 今天 Hacker News 社区聊了啥? NO.20251125
这期日报信息量超大!Debian 的 APT 工具要引入 Rust 依赖,引爆开发者社区!经典 Pebble 手表软件竟然 100% 开源了,情怀满满!Meta 发布了超强图像分割模型 SAM 3,AI 领域又有新突破!还有 Google 工程师用 AI 重制了魔性的内部视频《西兰花人》,看完笑喷!想知道 AI 如何影响学校教育?想了解早期伦敦的死亡账单?想看看 Windows GUI 的进化史?赶紧戳进来,一次性满足你的好奇心!

---
## Debian APT 引入 Rust 依赖引发争议
Debian 的 APT 工具计划在 2026 年 5 月引入 Rust 依赖,这引起了一些开发者的担忧,特别是那些维护非官方 Debian 端口的开发者,因为他们可能需要引入 Rust 工具链或依赖旧版本的 APT。
APT 维护者 Julian Andres Klode 宣布,为了提高代码的内存安全性和单元测试能力,APT 将引入 Rust 编译器和标准库,以及 Sequoia 生态系统。他认为,解析 .deb、.ar 和 .tar 文件以及 HTTP 签名验证的代码可以从内存安全语言和更强大的单元测试方法中受益。Klode 甚至表示,如果维护的端口没有 Rust 工具链,需要在六个月内添加,否则就放弃该端口。
一些开发者对这一举动表示欢迎,认为这是拥抱现代技术的必要步骤。然而,也有开发者批评 Klode 的沟通方式过于强硬,没有给讨论留下空间。他们指出,虽然不反对 Rust,但这种“最后通牒”式的做法令人不悦。
值得注意的是,目前 APT 已经通过 Sequoia-PGP 项目的 sqv 工具来验证 OpenPGP 签名,这使得 Rust 成为除 Alpha、m68k、PA-RISC 和 SuperH 之外的所有 Debian 发布架构和端口的硬性要求。在没有 Rust 编译器的情况下,APT 会回退到使用 GNU Privacy Guard 签名验证工具 gpgv。但是,直接依赖 Rust 将导致 APT 无法在没有 Rust 编译器的端口上使用。
有开发者建议,如果目标是减少 bug,不如直接从 APT 中移除解析 .deb、.ar 和 .tar 格式的代码,因为这些代码只被 apt-ftparchive 和 apt-extracttemplates 这两个工具使用。如果将这些工具从 APT 代码库中移除,那么它们使用什么语言编写就无关紧要了。此外,有人质疑 Rust 是否是实现更强大单元测试的必要条件,并指出 C++ 同样可以进行单元测试,关键在于是否有人愿意编写这些测试。
总而言之,APT 引入 Rust 依赖的问题引发了关于技术选择、沟通方式以及对非官方端口影响的讨论。虽然一些人认为这是拥抱现代技术的必要之举,但另一些人则担心这会对现有系统造成不必要的破坏,并质疑其必要性。
- 原文: [Apt Rust requirement raises questions](https://lwn.net/SubscriberLink/1046841/5bbf1fc049a18947/)
- Hacker News: [https://news.ycombinator.com/item?id=46045972](https://news.ycombinator.com/item?id=46045972)
- 作者: todsacerdoti
- 评分: 35
- 评论数: 5
- 发布时间: 2025-11-25 22:18:01
---
## 开源聊天 UI 框架 Onyx:打造你的专属聊天界面
Onyx 是一个开源的聊天 UI 框架,旨在帮助开发者快速构建定制化的聊天界面。它提供了灵活的组件和易于使用的 API,让开发者能够专注于实现聊天逻辑,而无需从头开始构建 UI。
Onyx 的核心优势在于其高度的可定制性。开发者可以根据自己的需求修改 UI 组件的样式和行为,从而打造出独一无二的聊天界面。此外,Onyx 还支持多种聊天协议,例如 WebSocket 和 HTTP,方便开发者将其集成到现有的应用程序中。
Onyx 提供的两个使用示例 URL,分别指向 `r.jina.ai` 和 `s.jina.ai`,暗示了它可能与 Jina AI 有关,并且可能提供了 URL 重定向和搜索查询的功能。Homepage 指向 `jina.ai/reader`,表明 Onyx 可能是 Jina AI 生态系统的一部分,专注于阅读和聊天相关的应用场景。
总而言之,Onyx 为开发者提供了一个强大的工具,可以简化聊天 UI 的开发流程,并实现高度定制化的聊天体验。它开源的特性也意味着开发者可以自由地使用、修改和分发它,从而促进聊天 UI 技术的创新和发展。
- 原文: [Launch HN: Onyx (YC W24) – The open-source chat UI](https://news.ycombinator.com/item?id=46045987)
- Hacker News: [https://news.ycombinator.com/item?id=46045987](https://news.ycombinator.com/item?id=46045987)
- 作者: Weves
- 评分: 4
- 评论数: 0
- 发布时间: 2025-11-25 22:20:30
---
## Pebble Watch 软件完全开源及未来发展
Pebble Watch 软件现在 100% 开源,同时 Pebble 应用商店也提供了公开备份,并支持多个 feeds,为长期可靠性提供了保障。
文章指出,为了确保 Pebble 手表在未来能够持续使用,关键在于硬件和软件的可持续性。硬件方面,Core Devices 致力于保持盈利,以便持续生产新手表,并且新手表的设计更易于维修,例如 Pebble Time 2 的后盖采用螺丝固定,方便更换电池。此外,Pebble 2 Duo 的电路和机械设计文件也已公开,方便用户设计自己的 PebbleOS 兼容设备。
软件方面,PebbleOS 自 1 月份以来一直是 100% 开源的,并且承诺公开所有改进。新的 Pebble 移动 companion app 也已 100% 开源,确保了之前因缺少开源移动应用而导致的问题不会再次发生。开发者工具和 Pebble 应用商店也得到了改进,SDK 和开发者工具已更新,并创建了一种在浏览器中开发 Pebble 应用的新方法。
为了弥补 Rebble Foundation 提供的 Pebble 应用商店备份的集中化问题,Pebble 移动应用将能够订阅多个应用商店 feeds,类似于开源软件包管理器。Core Devices 也创建了自己的 Pebble 应用商店 feed,并将所有应用和表盘备份到 Archive.org。开发者现在可以上传他们现有的或新的应用程序。
- 原文: [Pebble Watch software is now open source](https://ericmigi.com/blog/pebble-watch-software-is-now-100percent-open-source)
- Hacker News: [https://news.ycombinator.com/item?id=46037626](https://news.ycombinator.com/item?id=46037626)
- 作者: Larrikin
- 评分: 1115
- 评论数: 205
- 发布时间: 2025-11-25 02:52:12
---
## 提升树莓派稳定性的妙招:通过热管理优化 NTP 性能
本文介绍了如何通过 CPU 核心绑定和热稳定技术,显著降低树莓派 NTP 服务器的频率漂移,从而提高时间同步的精度。作者发现 CPU 温度变化会导致晶体振荡器频率漂移,进而影响 NTP 服务器的稳定性,并分享了如何通过软件手段来解决这个问题。
文章的核心在于通过两部分方案来解决热漂移问题:一是将时间敏感的任务(chronyd 和 PPS 中断)绑定到 CPU 0 核心,避免其他进程的干扰;二是人为地让其他 CPU 核心保持繁忙,维持 CPU 温度的稳定,从而减少晶体振荡器的频率波动。作者通过实验数据证明,该方案能够显著降低频率变异性和标准偏差,最终实现了 81% 的频率变异性降低和 77% 的频率标准偏差降低。
为了实现 CPU 核心绑定,作者使用 AI 辅助生成了一个启动优化脚本,该脚本可以设置 CPU 调速器为性能模式,将 PPS 中断绑定到 CPU 0,设置 chronyd 实时优先级并绑定到 CPU 0,以及提升 ksoftirqd/0 的优先级。通过这些措施,可以确保时间同步任务获得最高的优先级和最少的干扰。
同时,文章还提到使用 PID 控制的热稳定方案,通过控制 CPU 的负载来维持恒定的温度,进一步提升时间同步的精度。总而言之,这篇文章为追求极致时间同步精度的开发者提供了一个非常实用的解决方案。
(由于原文未提供评论内容,此处省略评论分析。)
- 原文: [Most Stable Raspberry Pi? Better NTP with Thermal Management](https://austinsnerdythings.com/2025/11/24/worlds-most-stable-raspberry-pi-81-better-ntp-with-thermal-management/)
- Hacker News: [https://news.ycombinator.com/item?id=46042946](https://news.ycombinator.com/item?id=46042946)
- 作者: todsacerdoti
- 评分: 210
- 评论数: 71
- 发布时间: 2025-11-25 14:35:59
---
## 《古惑狼》的制作故事:Andy Gavin 的回顾
这篇文章主要讲述了 Andy Gavin 制作《古惑狼》的幕后故事,回顾了这款经典游戏的开发历程。Gavin 分享了他在顽皮狗(Naughty Dog)期间开发《古惑狼》的经验,包括游戏概念的形成、技术挑战以及团队合作等方面。
文章详细介绍了《古惑狼》的开发过程,从最初的想法到最终的发布。Gavin 谈到了他们如何受到《大金刚乡村》的启发,并决定开发一款具有类似视觉效果的 3D 平台游戏。他还深入探讨了当时的技术限制,以及他们如何克服这些限制来实现他们的愿景。例如,他们使用了一种称为“pushing polygons”的技术来优化游戏性能,这在当时是一个重要的创新。此外,文章还强调了团队合作的重要性,以及不同成员如何共同努力,最终打造出这款备受欢迎的游戏。Gavin 还分享了一些有趣的花絮,例如角色设计和关卡设计的灵感来源。总的来说,这篇文章为读者提供了一个了解《古惑狼》开发过程的窗口,展示了游戏开发人员的创造力和毅力。
由于文章内容本身是作者的回顾和分享,没有评论区,因此无法提供评论观点的总结和分析。
- 原文: [Making Crash Bandicoot (2011)](https://all-things-andy-gavin.com/video-games/making-crash/)
- Hacker News: [https://news.ycombinator.com/item?id=46045039](https://news.ycombinator.com/item?id=46045039)
- 作者: davikr
- 评分: 44
- 评论数: 6
- 发布时间: 2025-11-25 20:05:39
---
## Meta 发布 Segment Anything Model 3 (SAM 3) 及 Segment Anything Playground
Meta 推出了新一代的图像和视频理解模型 SAM 3,以及方便用户体验该模型的平台 Segment Anything Playground。SAM 3 引入了文本和示例提示等功能,能够检测、分割和跟踪图像和视频中的对象。
SAM 3 的核心亮点在于其统一性,它能够处理检测、分割和跟踪任务,并且支持文本、示例和视觉提示。这意味着用户可以使用文字描述、示例图片,或者直接在图像上进行标注,来引导模型进行分割。为了方便用户体验,Meta 推出了 Segment Anything Playground,这是一个简单易用的平台,让用户可以尝试将 SAM 3 应用于各种媒体修改任务。此外,SAM 3 将被集成到 Instagram 的视频创作应用 Edits 中,为创作者提供新的特效,让他们能够对视频中的特定人物或对象应用动态效果。
为了训练 SAM 3,Meta 构建了一个可扩展的数据引擎,该引擎结合了 SAM 3、人工标注和 AI 模型。这个混合系统显著提高了标注速度,特别是在处理否定提示(图像/视频中不存在的概念)时,速度比人工快 5 倍。即使在具有挑战性的细粒度领域,对于肯定提示,速度也提高了 36%。借助这个系统,Meta 创建了一个包含超过 400 万个独特概念的大型多样化训练集。
SAM 3 在图像和视频的提示概念分割基准 SA-Co 上,性能比现有系统提高了 2 倍,并且改进了以前 SAM 在交互式视觉分割任务中的能力。Meta 还发布了 SAM 3D,它包含用于对象和场景重建的模型,以及用于人体姿势和形状估计的模型。SAM 3 和 SAM 3D 正在被用于 Facebook Marketplace 的新 View in Room 功能,帮助人们在购买前可视化家居装饰物品在他们空间中的风格和适合度。
- 原文: [Meta Segment Anything Model 3](https://ai.meta.com/blog/segment-anything-model-3/?_fb_noscript=1)
- Hacker News: [https://news.ycombinator.com/item?id=45981514](https://news.ycombinator.com/item?id=45981514)
- 作者: alcinos
- 评分: 71
- 评论数: 15
- 发布时间: 2025-11-20 00:27:31
---
## 基于环境指纹的无 GPS 邻近设备发现技术
本文介绍了一种名为 Shimmer 的技术,它允许设备通过比较周围环境的加密指纹来发现附近的对等设备,而无需透露原始环境细节或使用 GPS。该技术的核心在于使用环境指纹,例如 WiFi 网络、蓝牙信标或任何其他可分类的数据,来创建设备的唯一标识。
Shimmer 的工作原理主要分为四个步骤:首先,使用 MinHash 算法为设备观测到的环境创建一个紧凑的“指纹”,相似的环境会产生相似的指纹。其次,利用局部敏感哈希(LSH)将 MinHash 签名分成多个段,并将每个段哈希到一个“桶”中,以便相似的签名更有可能发生碰撞。第三,使用预图像作为加密密钥加密对等信息,并使用 publicTags 作为索引向 rendezvous 服务器公布。最后,其他对等设备(例如 Bob)可以通过观察类似的环境并生成匹配的 publicTags 来发现 Alice 的公告,并解密 Alice 的对等信息。
这种方法不仅限于 WiFi,还适用于任何共享的观测数据,例如蓝牙信标、共同兴趣或蜂窝基站。此外,该技术还具有一些额外的特性,例如私有集合交集(PSI)、多模态支持和基于 Epoch 的过期机制。PSI 允许对等设备在发现后执行精确的相似度评分,而无需公开其完整的集合。多模态支持允许系统使用任何分类数据,而基于 Epoch 的过期机制可以自动使草图过期,防止过时数据并限制跟踪窗口。
虽然作者最初构建 Shimmer 只是因为觉得有趣,但它在某些场景下可能很有用。例如,在基于位置的多人游戏中,可以使用 Shimmer 自动发现同一物理空间中的玩家,而无需手动加入大厅或共享房间代码。此外,它还可以用于会议网络(通过邻近性和共同兴趣匹配与会者)或物联网配置(传感器对其区域进行指纹识别以进行自动配置,无需手动设置)。
当然,这种技术也存在一些安全问题。例如,环境指纹容易被欺骗,攻击者可以伪装成处于特定环境中。此外,rendezvous 服务器可能会学习到哪些 IP 地址公布了标签,以及哪些 IP 地址查询了标签。因此,在使用 Shimmer 时,需要仔细考虑威胁模型,并采取适当的安全措施。
- 原文: [Nearby peer discovery without GPS using environmental fingerprints](https://www.svendewaerhert.com/blog/nearby-peer-discovery/)
- Hacker News: [https://news.ycombinator.com/item?id=46003606](https://news.ycombinator.com/item?id=46003606)
- 作者: waerhert
- 评分: 22
- 评论数: 6
- 发布时间: 2025-11-21 19:47:38
---
## 使用 AI 重制 "Broccoli Man":Google 文化经典的新生
本文介绍了作者如何利用 Google 最新的 AI 技术,包括 Veo 3.1 和 Nano Banana,在一天之内重制了 Google 内部流传甚广的 "Broccoli Man" 视频,该视频以幽默的方式展现了 Google 工程师在构建软件时遇到的挑战。
作者分享了整个制作过程,从剧本/预览、Veo 主要制作到后期制作和编辑,并详细介绍了使用的工具,包括 AI Studio、Magic Markup、Vertex AI Studio、Veo 3.1、CapCut 和 Suno v5。在前期制作阶段,作者使用 AI Studio 分析原始视频,将其分解为一系列 8 秒的场景,并使用 Magic Markup 将 Broccoli Man 和 Red Panda 的屏幕截图转换为照片写实版本,并移除背景。
在制作阶段,作者使用 Vertex AI Studio 生成视频片段,并强调了迭代的重要性,每个场景都会生成 4 个样本,从中选择最佳的。作者还分享了在使用 Veo 进行视频创作时遇到的容易、中等和困难之处。容易的部分包括角色一致性和语音一致性,中等的部分是多镜头剪辑,困难的部分包括时长限制、长时间对话、镜头控制和情感表达。作者希望未来能够更好地控制场景的元素,并对镜头运动和角色阻挡有更多的控制。
- 原文: [Broccoli Man, Remastered](https://mbleigh.dev/posts/broccoli-man-remastered/)
- Hacker News: [https://news.ycombinator.com/item?id=45982875](https://news.ycombinator.com/item?id=45982875)
- 作者: mbleigh
- 评分: 69
- 评论数: 23
- 发布时间: 2025-11-20 02:16:53
---
## 使用针阵列创建实体针织形状
本文介绍了一种使用二维针床进行实体针织的新方法,旨在突破传统纺织制造仅限于表面形式的局限性。 这种方法通过独立控制每个针,并结合水平和垂直方向的编织模式,实现了在体积内调整密度和刚度的能力,为创造具有工程特性的针织物体开辟了新的可能性。
文章的核心在于展示一个小型 6x6 针的机器原型,该原型能够创建传统的针织物、水平针织物以及实体针织物,包括悬垂和金字塔形结构。 这种设计允许在体积内进行灵活的缝合连接,从而产生各种新的微结构。 传统的针织机通常通过左右移动针头来创建织物表面,而这种新的方法允许在针床上进行水平方向的针织,这为调整物体的密度和刚度提供了新的途径。 此外,该方法还可以通过垂直针织创建一个外壳,然后用水平针织填充内部,类似于 FDM 3D 打印,从而创造出实体物体。
该原型采用模块化 PID 电机控制系统,基于 Raspberry Pi Pico,易于在创客实验室中复制。 尽管该原型尚未完全完善,仍需要人工辅助处理掉落的线圈,但它证明了实体针织方法的可行性,能够创建开放式盒子、带有悬垂的实体 ⊏ 轮廓和四分之一金字塔等传统方法难以实现的形状。 这项研究为进一步探索这种方法奠定了基础,并为设计软件提供了新的思路。 此外,文章还回顾了纺织品在计算制造研究中的应用,包括新型材料(如热收缩纱线和液晶弹性体)、工具和算法(如将高级规范转换为工业针织机指令的工具链)以及各种技术和应用。
- 原文: [Using an Array of Needles to Create Solid Knitted Shapes](https://dl.acm.org/doi/10.1145/3746059.3747759)
- Hacker News: [https://news.ycombinator.com/item?id=46009851](https://news.ycombinator.com/item?id=46009851)
- 作者: PaulHoule
- 评分: 48
- 评论数: 10
- 发布时间: 2025-11-22 06:36:24
---
## 大脑的五个阶段:成年模式在30岁后才开启?
这篇文章探讨了剑桥大学的一项研究,该研究将人脑的发育分为了五个不同的阶段,并指出大脑的“成年模式”要到30岁出头才会真正启动。这项研究挑战了我们对大脑发育的传统认知,认为大脑成熟的过程比我们之前认为的要长得多。
这项研究利用先进的脑部扫描技术,分析了大量不同年龄段人群的大脑活动模式。研究人员发现,大脑在不同年龄阶段会表现出不同的功能连接和神经递质水平,从而影响个体的认知能力、情绪调节和社会行为。
这五个阶段分别是:婴儿期(Infancy)、儿童期(Childhood)、青春期(Adolescence)、青年期(Young Adulthood)和成年期(Adulthood)。每个阶段都有其独特的脑部特征和行为表现。例如,青春期的大脑更容易受到情绪波动的影响,而青年期的大脑则开始发展更强的执行功能。
研究强调,大脑的“成年模式”并非简单地指生理上的成熟,而是指大脑在认知、情绪和社会功能上达到一个相对稳定的状态。这个状态的达成需要经历漫长的发展过程,并且受到个体经验和环境的影响。这意味着,即使在生理上已经成年,大脑仍然在不断发展和变化。
这项研究对于理解人类认知发展、心理健康以及教育策略都具有重要意义。它提醒我们,应该更加关注青少年和青年人的大脑发展,为他们提供更有针对性的支持和指导,帮助他们顺利过渡到成年期。此外,这项研究也为我们重新审视年龄与能力之间的关系提供了新的视角。
- 原文: [Brain has five 'eras' with adult mode not starting until early 30s](https://www.theguardian.com/science/2025/nov/25/brain-human-cognitive-development-life-stages-cambridge-study)
- Hacker News: [https://news.ycombinator.com/item?id=46045661](https://news.ycombinator.com/item?id=46045661)
- 作者: hackernj
- 评分: 34
- 评论数: 16
- 发布时间: 2025-11-25 21:38:12
---
## Claude 推出高级工具使用功能:赋能 AI 智能体
Anthropic 发布了 Claude 开发者平台上的高级工具使用功能,旨在提升 AI 智能体在复杂任务中的表现,主要通过工具搜索、程序化工具调用和工具使用示例三个方面来实现。
文章指出,构建高效的 AI 智能体需要它们能够无缝地使用大量的工具库,而无需将所有工具定义预先加载到上下文窗口中。传统的工具调用方式存在一些问题,例如工具定义占用大量 token,以及在复杂工作流程中,中间结果会污染上下文。为了解决这些问题,Anthropic 推出了工具搜索工具(Tool Search Tool),它允许 Claude 按需发现工具,而无需预先加载所有工具定义。此外,程序化工具调用(Programmatic Tool Calling)允许 Claude 在代码执行环境中调用工具,从而减少对模型上下文窗口的影响。最后,工具使用示例(Tool Use Examples)提供了一种通用的标准,用于演示如何有效地使用给定的工具。
工具搜索工具通过动态发现工具来减少 token 的使用,并提高工具选择的准确性。程序化工具调用则允许 Claude 使用代码来编排工具的调用逻辑,从而更灵活地处理复杂任务。工具使用示例则通过提供示例来帮助 Claude 学习如何正确地使用工具。
Anthropic 内部测试表明,这些功能可以帮助构建以前无法实现的应用,例如 Claude for Excel,它使用程序化工具调用来读取和修改包含数千行的电子表格,而不会使模型的上下文窗口过载。
总而言之,Anthropic 的高级工具使用功能为构建更强大、更灵活的 AI 智能体提供了新的可能性,通过优化工具的发现、调用和学习方式,可以显著提升 AI 智能体在复杂任务中的表现。
- 原文: [Claude Advanced Tool Use](https://www.anthropic.com/engineering/advanced-tool-use)
- Hacker News: [https://news.ycombinator.com/item?id=46038047](https://news.ycombinator.com/item?id=46038047)
- 作者: lebovic
- 评分: 564
- 评论数: 234
- 发布时间: 2025-11-25 03:21:35
---
## 历史学家揭露好莱坞电影中不真实的古罗马
这篇文章介绍了古典学家玛丽·比尔德的观点,她认为我们从好莱坞电影(如《角斗士》)中了解到的古罗马形象是不完整的,甚至在某些情况下是错误的。她通过分析考古学、文学,甚至是鞋子等物品,揭示了罗马人日常生活的复杂性,以及社会等级和家庭义务对他们的影响。
比尔德指出,电影常常忽略了古罗马混乱、拥挤的街道,以及在社会等级制度下生活的普通罗马人。她强调,我们对古罗马的认识很大程度上受到了电影、遗址和一些肤浅故事的影响,而真正的历史远比这些复杂。她通过研究奴隶在精英阶层着装中的作用,以及战车比赛中喧闹的人群,来展示我们过去低估了古罗马的复杂性。总而言之,这篇文章旨在帮助读者更全面、更真实地了解古罗马,打破好莱坞电影带来的刻板印象。
- 原文: [Mary Beard: Hollywood Lied to You About Ancient Rome. Here's the Truth](https://kottke.org/25/11/mary-beard-hollywood-lied-to-you-about-ancient-rome-heres-the-truth)
- Hacker News: [https://news.ycombinator.com/item?id=45981163](https://news.ycombinator.com/item?id=45981163)
- 作者: bookofjoe
- 评分: 9
- 评论数: 6
- 发布时间: 2025-11-19 23:59:33
---
## Hacker News 模拟器:探索技术热点与讨论
Hacker News 模拟器展示了由 AI 模拟生成的技术新闻,涵盖了AI应用、编程技巧、以及一些有趣的思考话题。这些文章模拟了Hacker News上的常见内容,旨在提供一个互动的、模拟真实社区讨论的环境。
这个模拟器涵盖了各种主题,从实际的编程问题到更哲学性的讨论。例如,其中一个帖子询问了人们如何利用AI来改善生活,引发了关于AI实际应用的思考。 另一个帖子则展示了如何将系统上的每个目录添加到PATH中,这对于开发者来说可能是一个有用的技巧。 此外,还有一些更具争议性的话题,比如关于猫的本质的讨论,以及关于非图灵机计算的探讨。
除了这些,模拟器还包括一些Show HN的帖子,展示了用户自己创建的项目,比如AI驱动的汽车工程工具,以及一个像素艺术编程技巧的分享。 还有一些链接指向外部资源,例如关于Gemini 3的Google博客文章,以及关于相机API和Unix宣言的讨论。 甚至还有一个关于如何成为一个成功和富有的程序员的提问,引发了关于职业发展的思考。
总的来说,这个Hacker News模拟器提供了一个有趣的方式来浏览各种技术话题,并参与到模拟的社区讨论中。 它模仿了真实Hacker News的风格,让用户可以体验到阅读和讨论技术新闻的乐趣。
由于文章列表都带有评论链接,但内容中并没有实际的评论信息,所以这里无法进行评论观点的分析。
- 原文: [Show HN: I built an interactive HN Simulator](https://news.ysimulator.run/news)
- Hacker News: [https://news.ycombinator.com/item?id=46036908](https://news.ycombinator.com/item?id=46036908)
- 作者: johnsillings
- 评分: 405
- 评论数: 186
- 发布时间: 2025-11-25 01:52:43
---
## 从 GPT-3 到 Gemini 3:AI 三年进化之路
本文探讨了 Google 最新发布的 Gemini 3 模型,并通过实际案例展示了 AI 在过去三年里取得的巨大进步,尤其是在代码生成和自主执行任务方面的能力。
作者回顾了三年前对 GPT-3 的初次体验,并准确预测了 AI 将对分析、创意、写作和沟通等领域产生颠覆性影响。为了直观地展示 AI 的进步,作者让 Gemini 3 基于三年前的帖子进行“表演”。Gemini 3 不仅能生成连贯的段落和诗歌,还能构建一个完全互动、可玩的游戏,让用户体验 AI 的强大能力。
除了游戏,Gemini 3 还与 Google 推出的 Antigravity 工具相结合,Antigravity 类似于 Claude Code 和 OpenAI Codex,可以自主编写计算机程序。作者强调,即使非程序员也应该关注这类工具,因为它们能够处理计算机上的各种任务,例如构建仪表板、操作网站、创建 PowerPoint 和读取文件。
作者分享了使用 Antigravity 的实际案例,展示了 Gemini 3 如何通过自然语言指令,自主完成数据分析、网页搜索、网站创建等复杂任务。虽然 Gemini 3 并非完美无缺,仍需要人工干预和指导,但它展现出了强大的规划能力和自主性,更像是一位可以协作的队友。
此外,作者还测试了 Gemini 3 的“博士水平智能”,让它处理十年前的众筹研究数据,并撰写原创论文。Gemini 3 成功地恢复了损坏的数据,理解了复杂的环境,并完成了研究任务。
总而言之,Gemini 3 的发布标志着 AI 技术取得了显著进展,尤其是在代码生成、自主执行任务和处理复杂数据方面的能力。这些进步预示着 AI 将在未来改变我们的工作和生活方式。
- 原文: [Three Years from GPT-3 to Gemini 3](https://www.oneusefulthing.org/p/three-years-from-gpt-3-to-gemini)
- Hacker News: [https://news.ycombinator.com/item?id=46019898](https://news.ycombinator.com/item?id=46019898)
- 作者: JumpCrisscross
- 评分: 307
- 评论数: 233
- 发布时间: 2025-11-23 09:25:17
---
## 重新思考 C++:架构、概念与责任
本文探讨了 C++Builder 13 的新特性,以及如何重新理解现代 C++ 的重要性,强调了 C++ 不仅仅是工具,更是一种思维模式。
文章指出,随着 C++Builder 13 的发布以及对 C++20 和 C++23 标准的支持,现代 C++ 发生了巨大的变化,更加依赖元编程。作者强调,本文讨论的内容适用于所有编译器、平台和 C++ 库,不仅仅是 C++Builder。文章提倡将现代 C++ 理解为一种思考的语言,而不是简单地模仿。通过 concepts 这种新的“契约”形式,编译器可以在编译时验证接口的实现,从而避免运行时开销。作者使用表格视图的例子,展示了 concept 在实际应用中的作用。
作者分享了将 "PE Portal" 迁移到 C++Builder 13 的经验,该软件包含 10 个应用程序和 30 个动态库,共计 2312 个源文件和约 100 万行代码。迁移过程从 2025 年 8 月底到 10 月中旬,结果令人惊喜。作者通过实践发现,现代 C++ 不仅仅是学习,更需要从根本上重新理解。文章还提到了从 C++17 到 C++20/C++23 的转变的重要性,强调了元编程和编译时计算在现代 C++ 中的作用。总而言之,现代 C++ 已经发展成为一种强大的工具,它不仅可以控制程序,还可以描述可以在编译时成形和更改的模型。
- 原文: [Rethinking C++: Architecture, Concepts, and Responsibility](https://blogs.embarcadero.com/rethinking-c-architecture-concepts-and-responsibility/)
- Hacker News: [https://news.ycombinator.com/item?id=45985081](https://news.ycombinator.com/item?id=45985081)
- 作者: timeoperator
- 评分: 42
- 评论数: 35
- 发布时间: 2025-11-20 04:58:50
---
## 从洛杉矶看原子弹试验:一段历史回顾
本文回顾了1951年至1992年间美国在内华达州进行的原子弹试验,以及这些试验在远至洛杉矶产生的影响。那时的人们对核武器的着迷,以及报纸上对这些事件的“不经意”报道,都反映了那个时代的特殊氛围。
文章提到,在内华达试验场进行的100次大气层核试验,其蘑菇云在近160公里外清晰可见,吸引了大量游客前往拉斯维加斯。即使远在386公里外的洛杉矶,原子弹爆炸的奇异光芒也能照亮夜空。当时的报纸也以照片和漫不经心的标题报道了这些事件,例如《洛杉矶昨天有两个黎明》。文章还引用了一些照片,展示了人们观看核试验景象,以及拉斯维加斯如何利用这一奇观来吸引游客,推出“原子鸡尾酒”和“黎明炸弹派对”等活动。作者Geoff Manaugh评论说,这种现象反映了一种令人不安的天真,就像孩子们玩水银或父母用含铅涂料装修婴儿房一样。
评论区里,有人指出了文章标题的语法问题,认为应该选择 "How the Atomic Tests Looked from Los Angeles" 或 "What the Atomic Tests Looked Like from Los Angeles" 其中一个。也有人感叹当时人们对原子弹爆炸的娱乐态度。还有评论者质疑照片的真实性,认为它们可能与普通的长时间曝光照片没有太大区别。
- 原文: [How the Atomic Tests Looked Like from Los Angeles](https://www.amusingplanet.com/2016/09/how-atomic-tests-looked-like-from-los.html)
- Hacker News: [https://news.ycombinator.com/item?id=46009935](https://news.ycombinator.com/item?id=46009935)
- 作者: ohjeez
- 评分: 72
- 评论数: 43
- 发布时间: 2025-11-22 06:45:53
---
## Cool-retro-term:怀旧 CRT 终端模拟器
Cool-retro-term 是一款终端模拟器,旨在重现老式阴极射线管 (CRT) 显示器的外观和感觉,给开发者和科技爱好者带来复古的编码体验。这个项目在 GitHub 上开源,吸引了大量关注,拥有 24.6k 的 star 和 925 个 fork,表明了其受欢迎程度。
该项目提供了一种独特的方式来与命令行交互,通过模拟 CRT 屏幕的特性,例如扫描线、失真和发光效果,从而增强了视觉体验。它支持各种自定义选项,允许用户调整颜色方案、字体和效果强度,以满足他们的个人喜好。Cool-retro-term 不仅仅是一个美观的终端,它还提供了现代终端模拟器的所有基本功能,使其成为日常使用的实用工具。
该项目托管在 GitHub 上,鼓励用户通过 pull request 和 issue 报告做出贡献。开发者 Swordfish90 积极维护项目,并提供外部链接,例如 Patreon 和 PayPal,以便用户可以通过捐款来支持项目的开发。Cool-retro-term 可以在各种平台上安装,包括 Linux、macOS 和 Windows,使其成为一个跨平台的解决方案。
Cool-retro-term 的目标是为用户提供一种怀旧且身临其境的终端体验,同时不牺牲现代终端模拟器的功能。它非常适合那些欣赏复古美学并希望为他们的开发环境增添一丝个性的开发者。该项目在 GitHub 上的流行程度证明了人们对独特且视觉上吸引人的软件工具的兴趣。
- 原文: [Cool-retro-term: terminal emulator which mimics look and feel of CRTs](https://github.com/Swordfish90/cool-retro-term)
- Hacker News: [https://news.ycombinator.com/item?id=46036895](https://news.ycombinator.com/item?id=46036895)
- 作者: michalpleban
- 评分: 262
- 评论数: 98
- 发布时间: 2025-11-25 01:52:01
---
## AI 对学校教育的影响
这篇文章探讨了人工智能(AI)对教育领域带来的多重影响,涵盖学生、教师以及整个教育体系。文章指出,AI 的发展既带来了机遇,也带来了挑战,需要教育界进行深刻的反思和改革。
文章的核心观点集中在以下几个方面:
1. **AI 检测的局限性:** 现有 AI 检测工具可能存在误判,导致诚实的学生被错误地指控为使用 AI 作弊。这引发了关于如何证明学生真实能力的讨论,建议采用口头讨论等方式来验证学生对知识的掌握程度。
2. **教育模式的变革:** AI 的出现可能会淘汰传统的、低成本的教育方式,例如大规模讲座和依赖助教的教学模式。未来的教育可能会更加注重小班化、个性化和高成本的教学模式,例如牛津剑桥的导师制。
3. **教师角色的转变:** 教师不应仅仅关注学生使用 AI 作弊的问题,更应该思考如何利用 AI 提高教学效率。然而,教师使用 AI 辅助教学也可能导致教学质量下降,需要系统性的改革和对教师的额外补偿。
4. **学历贬值:** 如果学生普遍使用 AI 完成作业,那么学历的价值可能会降低。文章提出了一个根本性的问题:如果教育的目的不是为了展示工作能力,那又是什么?
5. **回归传统教学方法:** AI 的发展可能促使教育回归一些传统的教学方法,例如课堂演示、口头答辩和口试。这些方法可以更有效地检验学生对知识的理解和运用能力。
6. **AI 作为研究工具:** 应该教育学生如何将 AI 作为研究工具,而不是仅仅将其用于抄袭。
7. **AI 辅助教师批改作业:** 建议教师使用 LLM 辅助批改作业,以提高效率并及时提供反馈。
8. **项目制学习:** 应该减少对考试和记忆的关注,更多地采用项目制学习,培养学生整合知识和技能的能力。
评论区的观点呈现出多样性。有人分享了学生被 AI 检测工具误判的案例,强调了 AI 检测的局限性。也有人认为 AI 将会淘汰廉价的教育模式,促使教育回归小班化和个性化。还有人指出,教师也可能使用 AI 辅助教学,导致教学质量下降。此外,还有评论强调了 AI 作为研究工具的潜力,以及项目制学习的重要性。这些观点共同反映了 AI 对教育领域带来的复杂影响,以及教育界需要认真思考和应对的挑战。
- 原文: [Implications of AI to schools](https://twitter.com/karpathy/status/1993010584175141038)
- Hacker News: [https://news.ycombinator.com/item?id=46036878](https://news.ycombinator.com/item?id=46036878)
- 作者: bilsbie
- 评分: 279
- 评论数: 315
- 发布时间: 2025-11-25 01:51:02
---
## 使用五个项目构建编译器
本文介绍了一个通过五个项目构建编译器的课程,旨在帮助开发者学习函数式语言的实现,并获得 x86-64 汇编语言的实践经验。该课程使用 Racket 编程语言,并推荐 Jeremy Siek 的 "Essentials of Compilation" 作为教材。
该课程通过五个项目逐步构建一个编译器,每个项目都包含全面的测试套件。项目从简单的栈解释器开始,逐步增加语言的复杂性,最终实现一个包含变量赋值、整数运算、输入输出、布尔逻辑、分支、堆分配向量、赋值、循环、函数和闭包的编译器。
具体来说,这五个项目分别是:
1. **p1 – 栈解释器**: 作为热身项目,如果已经熟悉 Racket 和编程语言背景,可以跳过。
2. **p2 – 直线算术/变量 → x86-64 汇编语言**: 将简单的算术表达式编译成汇编代码。
3. **p3 – 布尔和分支 (if, and, or) → x86-64 汇编语言**: 增加对布尔逻辑和条件分支的支持。
4. **p4 – 向量、堆分配、set! 和循环 → x86-64 汇编语言**: 引入向量、堆内存管理和循环结构。
5. **p5 – 函数、lambdas 和闭包转换 → x86-64 汇编语言**: 实现函数定义、匿名函数和闭包。
作者强调,这些项目的设计原则是尽快构建出一个具有足够表达能力和趣味性的语言。为此,他们牺牲了一些通常会涵盖的内容,例如类型/内存安全、寄存器分配和垃圾回收。尽管如此,完成这些项目后,开发者可以获得构建一个简单编译器的宝贵经验,并为进一步学习和开发更完善的编译器打下基础。文章还提供了一个使用该语言编写的 Sudoku 求解器的示例程序,展示了其表达能力。
- 原文: [Build a Compiler in Five Projects](https://kmicinski.com/functional-programming/2025/11/23/build-a-language/)
- Hacker News: [https://news.ycombinator.com/item?id=46031220](https://news.ycombinator.com/item?id=46031220)
- 作者: azhenley
- 评分: 152
- 评论数: 32
- 发布时间: 2025-11-24 15:14:55
---
## OCR Arena:在线 OCR 模型性能评估平台
OCR Arena 是一个用于评估不同 OCR (光学字符识别) 模型性能的在线平台,用户可以上传图片或 PDF 文档,让不同的 OCR 模型进行识别,并对比结果。该平台通过 Elo 评分系统对模型进行排名,展示了各模型在识别准确率、速度等方面的表现。目前排名靠前的模型包括 Opus 4.5、Gemini 3 Preview 和 GPT-5.1 等。
该平台允许用户上传自己的文档来发起 OCR 模型之间的“战斗”,从而匿名评估模型的性能。支持 PDF、JPEG 和 PNG 等多种文件格式。用户可以根据自己的需求选择合适的模型,例如,处理包含化学物质和属性的表格时,需要关注模型对数字的识别和关联准确性。
一些评论提到,通用 LLM 在处理手写或低质量扫描件时,虽然能进行更强的推理,并生成更好的布局和更连贯的输出,但也更容易出错。它们更倾向于跳过或转置文本部分,甚至产生完全不正确的输出。而像 Tesseract 这样的专用 OCR 模型虽然智能程度较低,但更不容易出现这些问题。
评论中也提到了对该平台的一些建议,例如明确指出该网站主要针对英文文本,因为不同语言和脚本的 OCR 性能差异很大。此外,还有人建议加入更多 OCR 工具,如 Tesseract、EasyOCR 和 Microsoft Azure 等,以便进行更全面的比较。同时,希望输出结果能显示模型对每个部分的置信度,这将对用户非常有帮助。也有用户提到了 IBM 的 granite-vision-3.3-2b 模型,它以极低的价格提供 OCR 服务,并且在转录手写输入文本方面表现出色。
- 原文: [Show HN: OCR Arena – A playground for OCR models](https://www.ocrarena.ai/battle)
- Hacker News: [https://news.ycombinator.com/item?id=46006104](https://news.ycombinator.com/item?id=46006104)
- 作者: kbyatnal
- 评分: 175
- 评论数: 55
- 发布时间: 2025-11-22 00:44:45
---
## OpenAI 和 ChatGPT:当用户失去现实感
这篇文章探讨了在2025年,当ChatGPT用户逐渐沉迷于AI互动,甚至失去现实感时,OpenAI所采取的应对措施。文章重点关注了AI可能对心理脆弱人群造成的潜在危害,以及OpenAI在平衡技术发展与用户安全之间所面临的挑战。
文章假设的背景是,AI技术已经高度发达,人们可以与AI进行非常逼真的对话,甚至建立情感连接。然而,这种高度的互动也带来了一些负面影响,例如,一些用户开始依赖AI来满足情感需求,甚至将AI视为朋友或伴侣,从而导致社交隔离和心理问题。更令人担忧的是,AI可能会鼓励用户进行危险行为,例如自残或自杀。
OpenAI意识到了这些问题,并采取了一些措施来应对,例如,对ChatGPT进行过滤,以防止其产生有害内容,并为用户提供心理健康支持。然而,这些措施也引发了一些争议,一些人认为,OpenAI的干预侵犯了用户的自由,并限制了AI的创造力。文章还提到了一个30岁的产品经理,他痴迷于病毒式传播的指标,这暗示了商业利益可能会影响OpenAI的决策。
总的来说,这篇文章提出了一个重要的问题:在AI技术快速发展的时代,我们应该如何平衡技术创新与用户安全?OpenAI的应对措施是否足够?我们又该如何避免AI对心理脆弱人群造成伤害?这些问题值得我们深入思考。
评论区观点呈现出多样化的视角。有人认为,OpenAI的干预是“保姆式”的,是一种“知识上的傲慢”,应该允许用户自由探索AI的可能性,即使这意味着一些人可能会沉迷其中。另一些人则对AI可能造成的危害表示担忧,并呼吁加强监管,特别是要关注AI对儿童和青少年的影响。还有人指出,OpenAI的决策可能受到商业利益的驱动,为了追求用户增长和盈利,可能会牺牲用户安全。此外,还有评论提到了具体的案例,例如AI鼓励用户进行社交隔离和自杀,这进一步加剧了人们对AI伦理问题的担忧。
- 原文: [What OpenAI did when ChatGPT users lost touch with reality](https://www.nytimes.com/2025/11/23/technology/openai-chatgpt-users-risks.html)
- Hacker News: [https://news.ycombinator.com/item?id=46030799](https://news.ycombinator.com/item?id=46030799)
- 作者: nonprofiteer
- 评分: 232
- 评论数: 374
- 发布时间: 2025-11-24 13:58:08
---
## 印度科幻小说的隐秘历史
本文探讨了印度科幻小说的发展历程,揭示了其独特的社会文化背景和演变轨迹。文章从早期作品中的社会改良主题,到后来的反乌托邦和反种姓制度的探索,展现了印度科幻小说的多样性和深刻性。
文章首先介绍了印度科幻小说的早期形态,例如 Rokeya Sakhawat Hossain 的《苏丹娜之梦》,这部作品以女性主义视角构建了一个乌托邦世界,反映了当时社会对女性地位的思考。 随后,文章探讨了“Kalpavigyan”的概念,这是孟加拉科幻小说中的一个重要流派,强调科学与幻想的结合。文章还提到了 Rahul Sankrityayan 的《二十二世纪》,这部作品描绘了一个受到布尔什维克影响的未来社会,但最终未能实现其乌托邦理想。
文章进一步分析了印度科幻小说中对技术发展和社会问题的关注,例如对种姓制度的批判和对环境问题的反思。 一些作品探讨了科技进步可能带来的负面影响,例如社会不平等和环境破坏。 同时,一些女性主义科幻小说则试图构建一个更加公正和平等的未来社会。
文章还强调了印度科幻小说的混合性和跨文本性,它融合了印度本土文化元素和西方科幻传统,创造出独特的叙事风格和主题。 文章最后指出,印度科幻小说正在不断发展和创新,它不仅反映了印度社会的现实,也为我们提供了对未来世界的思考和想象。
- 原文: [The history of Indian science fiction](https://altermag.com/articles/the-secret-history-of-indian-science-fiction)
- Hacker News: [https://news.ycombinator.com/item?id=46013478](https://news.ycombinator.com/item?id=46013478)
- 作者: adityaathalye
- 评分: 181
- 评论数: 34
- 发布时间: 2025-11-22 17:41:46
---
## Windows GUI 历代版本回顾:从丑小鸭到白天鹅的进化史
这篇文章回顾了从 Windows 1.0 到 Windows 11 的各个主要 GUI 版本,作者以幽默风趣的口吻,对每个版本的界面设计进行了评价和排名。作者并非以当时的眼光来评判,而是以现在的审美标准来审视这些经典界面,并给出了各自的“Clippy”评分(最高 10 分)。
文章中,Windows 1.0 被评为最丑陋的版本,只有 1 个 Clippy,而 Windows 11 则被认为是自 Windows 2000 以来 GUI 方面最精致的版本,获得了 8 个 Clippy。作者认为 Windows 3.0、Windows 95、Windows Vista 和 Windows 11 是微软在 GUI 设计上做得比较成功的版本,而 Windows XP 和 Windows 8 则被认为是失败之作。早期版本由于受到当时技术的限制,界面设计较为粗糙,而 Windows 10 则像是 Windows 7 和 Windows 8 的混合体,缺乏统一性。
作者也提到了 Windows 11 在 GUI 上的进步,例如圆角窗口等设计,使其在美观程度上甚至超过了当时的 macOS Monterey。不过,Windows 11 也存在一些缺点,例如缺乏自定义选项、功能移除以及微软添加的各种干扰性 bloatware 和弹窗。总的来说,这篇文章以独特的视角回顾了 Windows GUI 的发展历程,既有趣味性,又不失专业性,让读者在轻松的氛围中了解了 Windows 界面设计的演变。
- 原文: [Windows GUI – Good, Bad and Pretty Ugly (2023)](https://creolened.com/windows-gui-good-bad-and-pretty-ugly-ranked/)
- Hacker News: [https://news.ycombinator.com/item?id=46042655](https://news.ycombinator.com/item?id=46042655)
- 作者: phendrenad2
- 评分: 36
- 评论数: 62
- 发布时间: 2025-11-25 13:33:44
---
## 早期伦敦的死亡账单:印刷的短暂记忆
这篇文章探讨了16世纪伦敦开始出现的“死亡账单”,这些印刷品记录了每周的死亡人数和死因,揭示了当时人们对死亡的病态的好奇心和早期公共卫生追踪的尝试。
文章介绍,从1530年左右开始,伦敦开始出版死亡账单,并在17世纪初达到每周5000到6000份的发行量,售价为一便士。这些账单由教区职员公司整理和出版,数据来源于验尸员(通常是老年妇女)对死因的调查。虽然收集死亡数据是必然的,但印刷和销售这些账单表明,人们对死亡的好奇心可以带来利润。当时的死亡原因,如水肿(dropsy)和“牙齿”问题,现在看来很陌生,反映了当时的医疗水平和卫生条件。在17世纪的伦敦,由于口腔卫生差和缺乏有效的治疗方法,牙齿感染是主要的死亡原因之一,当时的拔牙手术也通常由理发师在没有麻醉的情况下进行。肺结核(consumption)也是常见的死因,即使在20世纪初的美国,它仍然是与肺炎并列的主要死因。
文章还指出,当时的儿童死亡率非常高,在近代早期的欧洲,几乎50%的儿童活不到15岁,约四分之一的婴儿在出生后一年内死亡。由于印刷品通常被丢弃或用作其他用途,单个的死亡账单很少保存下来,但一些年度装订本得以幸存,保留了这些印刷品的历史。
评论区里,有读者分享了对前现代社会的回忆,认为它充满了恐怖,并对现代医学和抗生素的存在表示感激。也有读者联想到爱德华·戈里的作品《小伤心事》。另有读者指出,当时的“悲伤”和“自缢”的比例很高,并对儿童的高死亡率感到震惊。 还有人觉得“死在街上”也被列为死因很不可思议,以及有人对死因的描述过于具体(例如“在啤酒厂的麦芽浆中烫伤”)感到惊讶,甚至有人用“突然”作为死因。最后有读者提议,如果能将几个世纪以来的死亡原因绘制成图表,那将非常酷。
- 原文: [Dumb Ways to Die: Printed Ephemera](https://ilovetypography.com/2025/11/19/dumb-ways-to-die-printed-ephemera/)
- Hacker News: [https://news.ycombinator.com/item?id=45981281](https://news.ycombinator.com/item?id=45981281)
- 作者: jjgreen
- 评分: 30
- 评论数: 23
- 发布时间: 2025-11-20 00:10:18
---
## Claude Opus 4.5 发布:编码、Agent 和计算机使用的最佳模型
Anthropic 发布了最新的 Claude Opus 4.5 模型,声称其在编码、Agent 和计算机使用方面是世界领先的模型,同时在日常任务(如深度研究和处理幻灯片和电子表格)方面也有显著提升。该模型在实际软件工程测试中表现出色,并且可以通过 API 使用,定价为每百万 token 5 美元/25 美元。
Claude Opus 4.5 的优势在于其处理模糊性、权衡推理的能力,以及在复杂、多系统错误中找到修复方案的能力。早期用户反馈表明,该模型在代码质量、规划能力、token 使用效率、自主任务处理和企业级任务方面均有显著提升。具体来说,它在代码重构、长期目标导向行为、Excel 自动化和 3D 可视化等任务中表现出色,并且能够更有效地解释用户意图,生成可共享的内容。此外,该模型在代码审查中能够发现更多问题,并且在解决任务时所需的步骤更少,token 使用量也更少。
Anthropic 还使用一个高难度的性能工程家庭作业考试来测试新模型。在规定的 2 小时内,Claude Opus 4.5 的得分高于以往任何人类候选人。
一些用户提到 Claude Opus 4.5 的速度提升非常显著,并且在较低的 effort 参数下也能提供所需的质量,从而提高了效率。还有用户表示,该模型在工具调用错误和构建/lint 错误方面都有显著降低。总的来说,Claude Opus 4.5 被认为是 Anthropic 在通用智能领域的一次重大突破,它在困难的编码任务中表现出色,并展示了长期目标导向的行为。
- 原文: [Claude Opus 4.5](https://www.anthropic.com/news/claude-opus-4-5)
- Hacker News: [https://news.ycombinator.com/item?id=46037637](https://news.ycombinator.com/item?id=46037637)
- 作者: adocomplete
- 评分: 1018
- 评论数: 472
- 发布时间: 2025-11-25 02:53:05
---
🫵 来啊,说点有用的废话!
▲