zhulink logo
自动夜间模式 日间模式 夜间模式
侧栏
0

【HN中文日报】速看!YouTube下载要变天?AI记忆重回SQL?还有各种神仙操作等你来解锁!

意外富翁的头像
|
|
|
## 今天 Hacker News 社区聊了啥? NO.20250924 今天这期信息量爆炸!从 yt-dlp 下载 YouTube 视频可能面临的新挑战,到 AI 代理记忆引擎回归 SQL 思路,再到亨廷顿舞蹈症基因疗法的突破性进展,每一条都值得你细细品味。还有旧金山停车执法人员追踪网站、Berghain 夜店算法挑战、S3 如何在慢速 HDD 上实现超高吞吐量等奇奇怪怪的知识点等你来探索。别犹豫了,赶紧下滑阅读全文,看看哪个话题戳中你的G点! ![Hacker News 中文精选](/static/mascot_article.webp) --- ## yt-dlp 即将迎来 YouTube 下载新规 yt-dlp 项目发布公告,预告了即将到来的 YouTube 下载新规,这将会影响所有依赖 yt-dlp 下载 YouTube 视频的用户。具体来说,YouTube 可能会实施新的限制或验证机制,以控制或限制第三方工具的下载行为。 这意味着未来使用 yt-dlp 下载 YouTube 视频可能会变得更加困难,或者需要用户进行额外的步骤来验证身份或绕过限制。开发者可能需要更新 yt-dlp 以适应这些变化,用户也需要及时更新他们的工具才能继续使用。这次变动可能会对那些依赖 yt-dlp 进行视频存档、离线观看或内容创作的用户带来不便。 目前公告中没有透露具体的实施时间和技术细节,但可以预见的是,yt-dlp 团队将会密切关注 YouTube 的政策变化,并努力寻找应对方案,以尽可能地保持 yt-dlp 的功能可用性。用户也应该关注 yt-dlp 的官方渠道,以便及时获取更新信息和解决方案。 - 原文: [Yt-dlp: Upcoming new requirements for YouTube downloads](https://github.com/yt-dlp/yt-dlp/issues/14404) - Hacker News: [https://news.ycombinator.com/item?id=45358980](https://news.ycombinator.com/item?id=45358980) - 作者: phewlink - 评分: 351 - 评论数: 171 - 发布时间: 2025-09-24 19:41:54 --- ## 为什么让用户选择文本如此重要? 这篇文章探讨了在用户界面中禁用文本选择功能的弊端,强调了文本的可选择性、可复制性对于用户理解和处理信息的重要性。作者以自己在Bumble约会软件上遇到的问题为例,说明了无法选择文本带来的不便,并呼吁开发者停止禁用文本选择功能。 文章指出,将文本设置为不可选择,实际上是将文本变成了图像,丧失了文本本身所具有的优势。文本应该是易于复制、翻译、访问和轻量级的,这些特性是人们处理信息的基础。作者认为,禁用文本选择是对用户理解、可访问性和意义的犯罪,开发者应该允许用户自由地使用文本。文章还提到了播客、视频和Web图形等其他媒体形式,指出它们在可操作性和可引用性方面不如文本。总之,作者强烈呼吁开发者尊重用户,允许他们选择和复制文本,从而提升用户体验。 评论区对文章的观点表示赞同,并从多个角度进行了补充和讨论。 * 有人指出,作者故意禁用了该页面的文本选择功能,以讽刺这种行为。 * 有人分享了在Microsoft Teams中无法复制实时字幕的经历,认为这种限制非常烦人。 * 有Web开发者认为,可点击的文本(如选项卡标题和按钮)可以禁用文本选择,以避免误操作。 * 有人表达了对随意选择文本的喜爱,并对禁用文本选择的网站表示不满。 * 有人提到了图片形式的文本(如表情包和证书),以及使用AI提取和翻译这些文本的需求。 * 有人分享了在Windows中使用触控笔时遇到的文本选择问题,并提供了Firefox的解决方案。 * 有人注意到,在禁用JavaScript的情况下,网站显示了一条友好的消息,但消息本身却无法选择。 * 有人认为,禁用文本选择会使PWA应用更像原生应用。 总的来说,评论区一致认为禁用文本选择是一种糟糕的用户体验,并希望开发者能够重视文本的可选择性。 - 原文: [Just Let Me Select Text](https://aartaka.me/select-text.html) - Hacker News: [https://news.ycombinator.com/item?id=45360475](https://news.ycombinator.com/item?id=45360475) - 作者: ayoisaiah - 评分: 77 - 评论数: 48 - 发布时间: 2025-09-24 21:56:37 --- ## 美国特勤局的“SIM卡农场”故事被指为虚假宣传 本文作者指出,美国特勤局宣称破获了一起重大国家安全威胁的案件,但实际上这只是一个普通的犯罪团伙利用大量SIM卡群发垃圾短信或转发国际电话。作者认为,特勤局夸大了事件的严重性,将其描绘成国家安全或间谍威胁,而实际上这只是一种常见的犯罪行为。 文章进一步解释了SIM卡农场的工作原理,它由一台运行Linux的计算机控制多个基带无线电和SIM卡,轮流发送垃圾短信,伪装成普通用户以逃避运营商的监管。作者还提到,虽然SIM卡农场有时会导致手机信号塔崩溃,但这并非罕见现象,真正的外国势力有更简单的方法来达到类似目的。文章引用纽约时报的报道,并批评其引用匿名官员和有争议的“专家”来佐证特勤局的说法,认为这是政府宣传的体现。作者呼吁读者信任像他这样的黑客的专业知识,而不是华盛顿的内部人士。 评论区中,有读者分享了一位中国留学生的观点,认为中国人普遍不信任官方媒体,将其视为宣传工具,而美国人则更容易受到媒体内容的影响,难以接受新闻中存在宣传的可能性。这位读者表示赞同该留学生的观点,认为纽约时报等主流媒体也存在宣传行为,应该以不同的角度看待。 - 原文: [That Secret Service SIM farm story is bogus](https://cybersect.substack.com/p/that-secret-service-sim-farm-story) - Hacker News: [https://news.ycombinator.com/item?id=45357693](https://news.ycombinator.com/item?id=45357693) - 作者: sixhobbits - 评分: 562 - 评论数: 278 - 发布时间: 2025-09-24 16:24:20 --- ## EU 年龄验证 App 缺乏桌面支持引发可用性问题讨论 欧盟数字身份钱包的年龄验证应用目前计划不提供桌面支持,这引发了一系列关于可用性、公平性和潜在市场垄断的讨论。该应用旨在验证用户年龄,以便访问受年龄限制的内容和服务,但仅支持 Android 和 iOS 平台,这引起了用户和开发者的担忧。 项目最初专注于移动平台,理由是它们覆盖了绝大多数用户和实际应用场景。然而,评论指出,这种做法忽略了那些没有智能手机或不使用主流移动操作系统的用户。有人认为,政府发布的解决方案应该确保不强迫公民成为特定公司的客户,尤其是在智能手机市场已经存在双头垄断的情况下。 此外,有人指出,即使在智能手机用户中,也并非所有人都使用带有 Google 操作系统。依赖 Play Integrity API 和硬件密钥认证等完整性机制,可能进一步限制了对自由 Android 环境 (AOSP) 的支持,使得在桌面环境实现这些机制变得更加困难。 评论中还提到了用户体验问题,例如,用户可能被迫在他们喜欢的色情网站上创建账户。此外,仅支持移动平台可能会对市场准入造成障碍,并对大型科技公司有利。 一些人建议,将钱包和凭证提供商分离,允许欧盟委员会、成员国和其他方(如开源解决方案)充当钱包,可以解决一些问题。此外,有人建议考虑使用 W3C 凭证管理 API,但这需要对第三方钱包更加开放。 总而言之,虽然项目专注于移动平台可以理解,但评论强调了桌面支持的重要性,以确保更广泛的可用性、避免市场垄断,并尊重用户的隐私和选择。 评论区主要围绕以下几个观点展开: * **平台覆盖范围不足:** 许多评论者认为,仅支持 Android 和 iOS 平台是不够的,应该考虑桌面用户和其他操作系统的用户。 * **公平性和可访问性:** 有人担心,仅支持主流平台可能会导致一些用户被排除在外,尤其是在政府发布的解决方案中。 * **市场垄断:** 依赖特定公司的平台可能会加剧市场垄断,并限制用户的选择。 * **隐私问题:** 有评论提到,用户可能被迫在不信任的网站上创建账户,这引发了隐私方面的担忧。 * **开源解决方案:** 有人建议,应该允许第三方(尤其是开源项目)使用相同的 API 来扩展功能和平台兼容性。 - 原文: [EU age verification app not planning desktop support](https://github.com/eu-digital-identity-wallet/av-doc-technical-specification/issues/22) - Hacker News: [https://news.ycombinator.com/item?id=45359074](https://news.ycombinator.com/item?id=45359074) - 作者: sschueller - 评分: 187 - 评论数: 106 - 发布时间: 2025-09-24 19:52:50 --- ## 使用 Anki、ChatGPT 和 YouTube 学习波斯语 本文作者分享了自己使用 Anki 卡片记忆、ChatGPT 辅助理解以及 YouTube 视频学习波斯语的经验。他利用 Anki 制作包含语法、罗马音和翻译的卡片,并结合 ChatGPT 快速解答学习疑问。此外,他还推荐使用 YouTube 上的双语字幕和速度调节功能,配合精听和跟读练习,提高波斯语的听力理解能力。 作者提到,他会从 YouTube 视频中截取关键信息制作 Anki 卡片,例如包含波斯语短语、罗马音以及英文或法文翻译的卡片。在 Anki 学习过程中,当遇到疑问时,他会利用 ChatGPT 的项目功能,通过截图提问,快速获得相关知识点的复习和解释。为了提高听力水平,作者推荐使用 Dual Subtitles 插件同时显示波斯语和英语字幕,并结合 Tweaks for YouTube 插件的快捷键功能,以 75% 的速度反复观看视频,进行精听和跟读练习。 评论区对作者的学习方法提出了不同的看法。有人分享了使用 Clozemaster 的经验,认为它能提供结构化的词汇学习和语法解释,适合初学者。也有人强调了持续练习的重要性,认为选择能保持学习动力的学习方式至关重要。另一些评论则批评作者没有充分利用 Anki 的功能,建议直接学习波斯语书写,并使用包含所有元音标记的教材,以及推荐了一些经典的波斯语教材,认为系统学习更为重要。总的来说,评论区对学习方法的多样性进行了探讨,强调了找到适合自己的学习方式的重要性。 - 原文: [Learning Persian with Anki, ChatGPT and YouTube](https://cjauvin.github.io/posts/learning-persian/) - Hacker News: [https://news.ycombinator.com/item?id=45359524](https://news.ycombinator.com/item?id=45359524) - 作者: cjauvin - 评分: 49 - 评论数: 16 - 发布时间: 2025-09-24 20:45:07 --- ## 如何领导一群专家 这篇文章探讨了在充满专家的团队中,技术领导者的角色定位以及如何有效地领导他们。核心观点是,领导者不必是房间里最聪明的人,而是最有效的沟通者和协调者。 文章首先指出,技术领导者的价值不在于拥有所有问题的答案,而在于知道在哪里找到答案,并将它们联系起来。领导者需要能够将技术团队的解释翻译成产品团队能够理解的语言,反之亦然。这需要领导者具备优秀的社交技能,能够理解不同团队的视角,并找到共同点。 文章强调,领导者需要关注团队的整体目标,避免陷入技术细节的争论而忽略了实际问题。领导者的职责是清晰地定义问题,并确保团队朝着解决问题的方向前进。此外,领导者还需要勇于承认自己的不足,鼓励团队成员分享他们的专业知识,并为他们提供发挥才能的空间。 文章还提到了翻译的重要性,领导者需要能够将技术语言翻译成产品语言和管理层语言,以便不同团队之间能够有效地沟通。最后,文章强调,领导者应该向团队解释决策背后的原因,而不是简单地命令他们执行。通过这种方式,领导者可以建立信任,并促进团队的协作文化。 总之,技术领导力在于连接和语境,而不是命令和控制。领导者是帮助团队理解他们共同演奏的歌曲的人,而不是试图演奏所有乐器的指挥。 - 原文: [How to Lead in a Room Full of Experts](https://idiallo.com/blog/how-to-lead-in-a-room-full-of-experts) - Hacker News: [https://news.ycombinator.com/item?id=45359604](https://news.ycombinator.com/item?id=45359604) - 作者: jnord - 评分: 44 - 评论数: 4 - 发布时间: 2025-09-24 20:52:52 --- ## 谁在资助“另类研究”?探索非传统科研的资金来源 本文深入探讨了那些不适合传统学术界、初创公司或大型企业的“另类研究”的资金来源,揭示了该领域的多样化资助模式。文章将资金来源分为非稀释性(不涉及所有权或财务回报预期)和稀释性(期望财务回报并可能涉及组织所有权)两种,并详细分析了各类资助者的特点和偏好。 文章指出,另类研究的资金来源多种多样,从慈善家设立的新机构,到DARPA举办的机器人竞赛,再到DAO资助的寿命延长项目,以及VC资助的伪装成公司的研究项目,不一而足。非稀释性资金对于那些无法创造可捕获价值或具有较长时间尺度和高度不确定性的研究至关重要。这类资金主要来自基金会、慈善聚合机构、政府组织和众筹平台。基金会通常通过项目官员在董事会设定的范围内运作,倾向于资助传统研究。慈善聚合机构则通过为特定项目筹款,具有更大的灵活性。政府机构如DARPA,通过OTA等方式支持竞赛项目,SBIR则为研究型初创企业提供资金。众筹平台适用于具有公众吸引力的项目,但筹款额度有限。 稀释性资金虽然能注入大量资源,但也可能将研究导向短期商业目标。天使投资人可能会出于对项目本身的热情而非投资回报进行投资。风险投资(VC)通常在特定领域“火热”时才会涉足此类研究,但也存在一些具有特殊结构的VC公司,能够以不同于传统的方式进行投资。此外,家族办公室通常同时进行稀释性和非稀释性投资。文章还提到了DAO(去中心化自治组织)和加密货币在资助另类研究方面的作用,但指出其波动性和投机性较高。最后,文章强调了在寻求资金时,需要根据研究的性质和目标,选择合适的资助者。 由于没有评论内容,此处省略评论分析。 - 原文: [Who Funds Misfit Research?](https://blog.spec.tech/p/who-funds-misfit-research) - Hacker News: [https://news.ycombinator.com/item?id=45361154](https://news.ycombinator.com/item?id=45361154) - 作者: surprisetalk - 评分: 6 - 评论数: 0 - 发布时间: 2025-09-24 22:44:20 --- ## 探索 ed(1) 文本编辑器的各种实现和脚本 本文深入探讨了作者对 ed(1) 文本编辑器的热爱,并介绍了 GNU ed、OpenBSD ed (oed)、wed (ed wImproved)、aed 以及 xed 等多种 ed(1) 的实现和脚本。作者分享了自己使用 ed(1) 作为 Git 编辑器、sudo 编辑工具,甚至是静态站点生成器的经验。 文章首先介绍了 GNU ed,它是标准文本编辑器,在大多数 UNIX/POSIX 系统上都可用。作者强调了 GNU ed 的稳定性和易于脚本化。随后,文章提到了 OpenBSD ed (oed),它更符合 POSIX 标准,可以提高脚本的可移植性。wed 则是支持脚本的 ed(1) 版本,适合想要入门 ed(1) 但又不想偏离传统的新手。aed 是作者自己开发的更友好的 ed(1) 版本,通过 Readline 和 shell 脚本提供更友好的交互体验,具有语法高亮和内联编辑功能。xed 是作者编写的脚本,旨在简化 ed(1) 的脚本编写,使其更接近 sed(1) 的用法。 此外,作者还表达了对 sed(1) 和 ex(1) 的看法,认为 ed(1) 已经足够强大,不需要 sed(1),而 ex(1) 则是 vi(1) 的一个集成不良的后端。最后,作者分享了自己用 Brainfuck、BASIC 和 Modal 等语言实现的 ed(1) 版本,展示了对 ed(1) 的深入理解和喜爱。文章鼓励读者使用 ed(1),并选择适合自己的实现。 评论区也分享了大家对 ed(1) 的看法。有人认为 ed(1) 在 shell 脚本中编辑文件非常有用,例如使用 heredoc 或管道 printf 输出。有人则认为在现代 IDE 过剩的时代,ed(1) 代表了一种极简主义的乐趣。还有人回忆起在 80 年代教授 Unix 课程时使用 ed(1) 的经历。甚至有人觉得有趣的是,ed 也是他父亲的名字,所以他一直在工作中输入他父亲的名字。评论区也从不同角度肯定了 ed(1) 的价值和意义。 - 原文: [My Ed(1) Toolbox](https://aartaka.me/my-ed.html) - Hacker News: [https://news.ycombinator.com/item?id=45359388](https://news.ycombinator.com/item?id=45359388) - 作者: mooreds - 评分: 36 - 评论数: 12 - 发布时间: 2025-09-24 20:31:52 --- ## 英国人权组织反对强制性数字身份计划 人权组织正在敦促英国首相放弃强制性数字身份计划。他们认为,强制性数字身份将从根本上改变公民与国家之间的关系,对公民自由造成不可逆转的损害,并且无法阻止非法移民。 Big Brother Watch 等组织致信首相,表达了对强制性数字身份计划的担忧。他们认为,虽然目前的数字身份提案是在移民背景下考虑的,但不能保证未来的政府不会要求使用数字身份来访问一系列公共和私人服务。该组织还发布了一份名为“Checkpoint Britain: the dangers of digital ID and why privacy must be protected”的报告,详细阐述了数字身份的潜在风险。报告指出,强制性数字身份可能导致大规模监控、歧视和排斥,并对言论自由和集会自由等基本权利构成威胁。 该组织强调,数字身份系统容易受到黑客攻击和数据泄露的影响,可能导致身份盗窃和欺诈。此外,数字身份系统还可能被政府滥用,用于追踪和控制公民的活动。他们呼吁政府重新考虑强制性数字身份计划,并探索其他更尊重公民自由和隐私的解决方案。 评论区里,有人认为,虽然不应该强制推行,但是数字身份如果能提高效率,方便公民生活也是好事,比如统一政府服务的登录,部门间共享数据(在用户授权的情况下),甚至在NHS(英国国家医疗服务体系)中也能发挥巨大作用。也有人提到,现在和英国的政府机构打交道需要大量的纸质证明,非常不方便,如果能用数字身份验证会方便很多。 总的来说,关于数字身份的讨论涉及效率、便利性与隐私、安全之间的权衡。如何找到一个平衡点,既能利用技术进步带来的好处,又能保护公民的基本权利,是需要认真思考的问题。 - 原文: [Rights groups urge UK PM Starmer to abandon plans for mandatory digital ID](https://bigbrotherwatch.org.uk/press-releases/rights-groups-urge-starmer-to-abandon-plans-for-mandatory-digital-id/) - Hacker News: [https://news.ycombinator.com/item?id=45359356](https://news.ycombinator.com/item?id=45359356) - 作者: Improvement - 评分: 103 - 评论数: 70 - 发布时间: 2025-09-24 20:28:15 --- ## AWS S3 如何在慢速 HDD 上实现每秒 1PB 的吞吐量 本文深入探讨了 AWS S3 如何利用大量 HDD 实现惊人的性能和扩展性,即使 HDD 本身存在速度瓶颈。S3 通过巧妙的工程设计,克服了 HDD 的物理限制,实现了高可用性、高耐用性和低成本。 文章指出,S3 拥有超过 400 万亿个对象,每秒处理 1.5 亿个请求,峰值流量超过 1PB/s,并且使用了数千万个磁盘。尽管 HDD 在价格、容量、尺寸和重量方面取得了显著进步,但其 IOPS 却停滞不前,导致每字节速度变慢。这是因为 HDD 依赖于物理机械运动来读取数据,包括寻道、旋转和传输速率,这些操作加起来导致平均随机 I/O 读取延迟约为 11 毫秒(0.5MB)。 为了解决这个问题,S3 采用了大规模并行处理。通过将数据分散在数百万个 HDD 上,S3 可以并行利用每个驱动器的吞吐量,从而实现巨大的读取吞吐量。例如,将 1TB 文件存储在单个 HDD 上,读取速率会受到该驱动器的最大吞吐量限制(约 300MB/s),但如果将同一文件拆分到 20,000 个不同的 HDD 上,则可以并行读取,总吞吐量达到 TB/s 级别。此外,S3 的存储后端 ShardStore 基于日志结构的合并树 (LSM),这使得写入操作能够顺序进行,从而充分利用 HDD 的性能。 文章还提到了纠删码,这是一种常见的存储系统冗余方案,主要用于数据持久性,防止硬件故障导致的数据丢失。 总之,S3 的成功之处在于它能够巧妙地利用廉价的 HDD,并通过大规模并行处理和优化的数据结构来克服其性能限制,最终实现了惊人的扩展性和性能。 - 原文: [S3 scales to petabytes a second on top of slow HDDs](https://bigdata.2minutestreaming.com/p/how-aws-s3-scales-with-tens-of-millions-of-hard-drives) - Hacker News: [https://news.ycombinator.com/item?id=45358280](https://news.ycombinator.com/item?id=45358280) - 作者: todsacerdoti - 评分: 100 - 评论数: 30 - 发布时间: 2025-09-24 18:05:29 --- ## Jina AI 的 Memori:使用 SQL 实现 AI 代理的类人记忆 Memori 是一个多代理记忆引擎,旨在赋予 AI 代理类似人类的记忆能力。它并没有采用常见的向量或图数据库方法,而是选择回归 SQL 数据库来存储和检索信息。Memori 提供了两种使用方式,并提供了一个主页供用户了解更多信息。 Memori 的核心思想是,AI 代理的“遗忘”并非因为逻辑错误,而是缺乏有效的记忆机制。通过使用 SQL,Memori 能够存储 AI 代理过去的对话和交互信息,并在需要时检索相关内容,从而使 AI 代理能够更好地理解上下文并做出更明智的决策。 这种方法的优势在于 SQL 数据库的成熟性和可靠性,以及其强大的查询能力。Memori 允许 AI 代理通过 SQL 查询来访问和利用其记忆,从而实现更灵活和精确的记忆检索。这对于需要长期记忆和复杂推理的 AI 应用来说至关重要。 然而,这种方法也面临一些挑战。例如,如何选择过去对话中与当前对话相关的部分?Memori 在处理大量记忆时,如何避免返回不相关的“记忆”?此外,将数据访问路径与 MongoDB 集成可能导致数据重复。 评论区对 Memori 的方法提出了多种观点。有人质疑 Memori 如何解决语义搜索的问题,例如如何通过查询“咖啡”来返回“浓缩咖啡”?也有人认为,Postgres 结合 pgvector 已经足够满足需求,不需要额外的抽象层。另一些人则认为,所有这些方法都是对现有系统的 hack,真正的解决方案应该是让基础模型能够存储和检索其内部的概念表示。总的来说,评论区对 Memori 的实用性和必要性存在一定的争议,但同时也认可其在 AI 记忆方面所做的探索。 - 原文: [Everyone's trying vectors and graphs for AI memory. We went back to SQL](https://news.ycombinator.com/item?id=45329322) - Hacker News: [https://news.ycombinator.com/item?id=45329322](https://news.ycombinator.com/item?id=45329322) - 作者: Arindam1729 - 评分: 34 - 评论数: 23 - 发布时间: 2025-09-22 13:18:12 --- ## 如何 HubSpot 通过情境化方法规模化 AI 应用 HubSpot 分享了他们如何从谨慎尝试到在工程团队中广泛采用 AI 编码工具的经验,重点在于战略投资、组织承诺和持续学习。他们强调了在扩展 AI 应用时,许多团队面临的挑战,并分享了他们的经验教训,希望能帮助其他团队更有效地应对这一过程。 HubSpot 在 2023 年夏天开始尝试 GitHub Copilot。公司创始人 Dharmesh 和 Brian 推动了这一进程,他们之前使用 Copilot 构建了 ChatSpot,并获得了良好的体验。HubSpot 通过一个大型试点项目验证了 Copilot 的潜力,并总结了成功的关键因素,包括高管的支持、充分规模的试点、积极的赋能措施以及全面的数据测量。 初步结果显示,工程师们对 Copilot 的反馈积极,并且生产力有适度的提高。HubSpot 认为,即使是适度的节省时间也足以证明这项投资是值得的。随着时间的推移,他们看到 AI 技术不断改进,生产力也随之提高。 HubSpot 强调了中心化团队的重要性。他们在 2024 年 10 月创建了一个开发者体验 AI 团队,专注于推动编码工具的采用、提高 AI 工具的影响、倡导 AI 应用、改进采购流程以及建立评估能力。这个团队的成立为 HubSpot 未来的成功奠定了基础。 通过收集更多数据,HubSpot 更加坚信 AI 工具对工程团队有积极影响。最初,由于经验和成本方面的考虑,他们对使用规则进行了限制。但在 2024 年 5 月,他们取消了这些限制,并主动为每个人提供了一个席位,从而使 AI 的采用率迅速超过 50%。 随着采用率超过 60%,HubSpot 意识到需要改变策略。他们通过同行验证、量化证明和提供更好的工具来应对怀疑论者,并更好地理解当前工具的局限性。 HubSpot 的经验表明,规模化 AI 应用需要战略性的方法、组织的支持和持续的投入。通过关注情境化、赋能团队和持续学习,企业可以成功地将 AI 集成到其工程流程中。 - 原文: [How HubSpot Scaled AI Adoption](https://product.hubspot.com/blog/context-is-key-how-hubspot-scaled-ai-adoption) - Hacker News: [https://news.ycombinator.com/item?id=45361140](https://news.ycombinator.com/item?id=45361140) - 作者: zek - 评分: 13 - 评论数: 0 - 发布时间: 2025-09-24 22:42:49 --- ## 准备好迎接 .NET 10 的 GC 变化 本文主要介绍了 .NET 10 中默认启用的 DATAS (Dynamic App-aware Tuning for Allocation Sizes) GC 特性,以及它与传统 Server GC 在性能上的差异,帮助开发者评估是否需要调整或关闭 DATAS。 DATAS 的引入是为了在内存受限的环境中,更好地适应应用程序的负载变化,尤其适用于容器化应用和小型 Server GC 应用。传统的 Server GC 并不主动适应应用程序的大小,而是主要基于各代的存活率进行垃圾回收。DATAS 的目标是在应用程序负载较低时缩小堆大小,在负载较高时扩大堆大小,从而更有效地利用资源。 文章详细解释了 DATAS 针对的两种特定场景:一是运行在内存约束环境中的突发性工作负载,二是使用 Server GC 的小型工作负载。对于前者,DATAS 可以帮助应用程序在非高峰时段释放内存,从而更好地适应容器的内存限制。对于后者,DATAS 可以提供更符合小型应用程序实际需求的堆大小。 然而,DATAS 并非适用于所有场景。对于那些追求最大吞吐量,不希望牺牲任何性能的团队来说,DATAS 可能会带来负面影响。文章建议开发者仔细评估 DATAS 对应用程序性能的影响,并根据实际情况决定是否启用或调整 DATAS。文章还提到,如果团队并不清楚释放的内存的用途,可能也不适合使用 DATAS。 文章还讨论了 DATAS 与传统 Server GC 在性能上的差异,以及开发者对 DATAS 的一些常见误解。要理解这些差异,需要了解两者在策略上的不同。Server GC 的目标不是适应应用程序的大小,而 DATAS 则会根据应用程序的负载动态调整堆大小。 总而言之,DATAS 是一项强大的 GC 特性,但需要根据具体的应用场景进行评估和调整。 - 原文: [Preparing for the .NET 10 GC](https://maoni0.medium.com/preparing-for-the-net-10-gc-88718b261ef2) - Hacker News: [https://news.ycombinator.com/item?id=45358527](https://news.ycombinator.com/item?id=45358527) - 作者: benaadams - 评分: 40 - 评论数: 29 - 发布时间: 2025-09-24 18:37:14 --- ## 亨廷顿舞蹈症首次成功治疗:基因疗法带来新希望 医生表示,一种新型基因疗法在治疗亨廷顿舞蹈症方面取得了首次成功,该疾病是一种家族遗传性神经退行性疾病,会无情地杀死脑细胞,类似于痴呆症、帕金森病和运动神经元疾病的结合。 研究数据显示,该疗法能减缓患者病情进展高达 75%,这意味着原本一年内的病情恶化,在使用该疗法后会延长至四年。该疗法通过一次 12-18 小时的脑外科手术进行基因治疗,旨在降低大脑中突变亨廷顿蛋白的水平。试验结果显示,治疗不仅减缓了疾病进展,还保护了脑细胞,参与试验的患者中,有人甚至从医学退休后重返工作岗位。 该疗法利用病毒将特定设计的 DNA 序列导入脑细胞,使神经元产生 microRNA,从而阻断突变亨廷顿蛋白的生成指令。试验涉及 29 名患者,结果显示,治疗三年后,在认知、运动功能和日常生活能力等综合指标上,疾病进展平均减缓了 75%。同时,脑脊液中的神经丝水平(脑细胞死亡的标志)也低于试验开始时,表明治疗具有保护脑细胞的作用。 尽管治疗被认为是安全的,但部分患者因病毒感染出现炎症反应,导致头痛和意识模糊,需要类固醇治疗。研究人员预计,由于脑细胞不像其他细胞那样可以再生,该疗法效果可能终身有效。UniQure 公司计划于 2026 年第一季度在美国申请许可,并在同年晚些时候推出该药物。 评论区有用户指出,此类医学突破并非仅由制药公司完成,还需要公共资金的支持,例如美国国立卫生研究院 (NIH)、美国国家科学基金会 (NSF) 以及英国国家健康研究所 (NIHR) 的资助。 强调了基础研究和公共资金在推动医学进步中的重要作用。 - 原文: [Huntington's disease treated for first time](https://www.bbc.com/news/articles/cevz13xkxpro) - Hacker News: [https://news.ycombinator.com/item?id=45358940](https://news.ycombinator.com/item?id=45358940) - 作者: _zie - 评分: 153 - 评论数: 45 - 发布时间: 2025-09-24 19:37:30 --- ## 西班牙足球赛事期间游戏服务器被屏蔽 这篇文章讨论了在西班牙足球比赛期间,游戏服务器遭遇屏蔽的问题。这导致用户在特定时间段内无法访问某些在线服务,甚至影响到了 Docker 镜像和 Ollama 模型的下载。 文章指出,这种屏蔽行为不仅仅影响游戏服务器,还涉及到 Cloudflare R2 和其他 CDN 服务,甚至整个 Backblaze B2 区域的部分 ISP 都受到了影响。有人分享了相关链接,用于追踪屏蔽情况。屏蔽的原因与西班牙 La Liga 采取的打击盗版行为有关,他们通过各种手段监控酒吧等公共场所是否非法播放足球比赛,甚至通过官方 App 收集用户数据。这种行为引发了关于法院过度干预和私人公司审查互联网的讨论。有人认为,法院将审查权力交给私人公司,却没有有效的监督机制,这是一种权力滥用。另一方面,也有人指出,如果 Cloudflare 等公司拒绝配合法院判决,法院将失去执行能力,从而可能导致更广泛的屏蔽。 评论区对此事观点不一。有人认为这种做法非常西班牙,也有人觉得这侵犯了互联网的自由。一些人对 Cloudflare 也表达了不满,因为他们也会随意屏蔽某些 IP 地址。还有人质疑 La Liga 是否有权要求 ISP 屏蔽特定 IP,以及 ISP 是否自愿配合。另一些评论则指出了类似的情况在意大利也存在,足球版权被分割,导致观看所有比赛的费用过高,年轻人对足球的兴趣正在降低。有人分享了 Hetzner 服务器因 Premier League 的禁令而被屏蔽的案例,即使服务器上没有盗版活动。总的来说,评论区既有对西班牙屏蔽行为的谴责,也有对相关公司和机构权力滥用的担忧。 - 原文: [My game's server is blocked in Spain whenever there's a football match on](https://old.reddit.com/r/gamedev/comments/1np6kyn/my_games_server_is_blocked_in_spain_whenever/) - Hacker News: [https://news.ycombinator.com/item?id=45358433](https://news.ycombinator.com/item?id=45358433) - 作者: greazy - 评分: 252 - 评论数: 118 - 发布时间: 2025-09-24 18:26:23 --- ## WiGLE:无线网络地图的众包平台 WiGLE (Wireless Geographic Logging Engine) 是一个用于收集和展示全球无线网络信息的平台。它通过用户上传的数据,构建了一个庞大的无线网络数据库,包括WiFi网络、蓝牙设备和手机基站的信息。 WiGLE 的核心功能包括:基础和高级搜索,允许用户根据各种参数(如SSID、BSSID、地理位置等)查找网络;地图功能,以可视化方式展示网络分布;数据上传功能,鼓励用户贡献数据;以及API,方便开发者集成WiGLE的数据。该平台还提供Android应用程序,方便用户在移动设备上进行网络扫描和数据上传。WiGLE 收集了海量的网络数据,包括超过16亿个WiFi网络,225亿次WiFi观测,43亿个蓝牙设备和2700万个手机基站。 WiGLE 还提供各种统计图表,展示WiFi网络和加密方式随时间的变化趋势。这些图表可以帮助用户了解无线网络的发展和安全状况。该平台还通过论坛、Mastodon、Bsky和Twitter等社交媒体渠道与用户互动,并提供FAQ、使用协议和隐私政策等文档。WiGLE 强调尊重用户隐私,并提供从数据库中移除接入点记录的途径。 评论区里,有用户感谢分享,表示之前不知道这个平台。也有用户提到了Netstumbler,可能是在对比类似的工具。还有用户表达了对WiGLE的怀旧之情,回忆起多年前使用它的经历。 - 原文: [WiGLE: Wireless Network Mapping](https://wigle.net/index) - Hacker News: [https://news.ycombinator.com/item?id=45359201](https://news.ycombinator.com/item?id=45359201) - 作者: dp-hackernews - 评分: 21 - 评论数: 3 - 发布时间: 2025-09-24 20:10:00 --- ## 挑战 Listen Labs Berghain:三天三夜的算法优化之旅 本文讲述了作者参与 Listen Labs Berghain 挑战赛的经历,这是一个需要玩家扮演夜店 Berghain 门口的接待员,根据特定规则筛选顾客的编程挑战。作者从一个算法新手,通过不断优化算法,最终在众多参与者中排名第 16。 文章详细描述了作者如何被这个挑战吸引,以及他是如何一步步改进自己的算法的。最初,作者建立了一个本地模拟器,这样他就可以在不依赖 Listen Labs 服务器的情况下进行实验。他最初的算法非常简单,只是接受任何能满足约束条件的人,但这种方法导致了很高的拒绝率。 随着时间的推移,作者不断改进他的算法,并从每次迭代中学习新的知识。他尝试了各种方法,包括构建一个完整的 Web 界面来逐步自动化决策过程。他还意识到,仅仅满足约束条件是不够的,还需要考虑到不同属性之间的相关性。 文章还提到了 Listen Labs 的服务器在挑战赛期间面临的巨大压力,以及参与者如何通过各种方式来绕过速率限制。这种稀缺性反而增加了人们参与的意愿。 总而言之,这篇文章生动地描述了一个程序员如何沉迷于一个具有挑战性的优化问题,并最终取得成功的经历。它不仅展示了解决问题的过程,也揭示了技术社区的活力和创造力。 - 原文: [I Spent Three Nights Solving Listen Labs Berghain Challenge (and Got #16)](https://kuber.studio/blog/Projects/How-I-Spent-Three-Nights-Solving-Listen-Labs-Berghain-Challenge) - Hacker News: [https://news.ycombinator.com/item?id=45322906](https://news.ycombinator.com/item?id=45322906) - 作者: kuberwastaken - 评分: 29 - 评论数: 8 - 发布时间: 2025-09-21 22:11:12 --- ## 探索 GrapheneOS 安全分配器:Hardened Malloc 本文深入探讨了 GrapheneOS 中名为 Hardened Malloc 的安全内存分配器,它旨在增强 Android 系统的安全性和隐私性。文章详细分析了其内部架构以及为防御常见的内存损坏漏洞而实施的安全缓解措施。 GrapheneOS 作为一个基于 Android 的强化操作系统,通过引入 Hardened Malloc 等安全机制,致力于保护设备上运行的进程。Hardened Malloc 的设计目标是防止内存损坏,它依赖于多种安全特性,包括扩展地址空间、安全应用生成以及内存标记扩展 (MTE)。扩展地址空间将用户态进程的地址空间从 39 位扩展到 48 位,增加了 ASLR 的熵,使得攻击者更难预测内存地址。安全应用生成则通过使用 `exec` 而不是 `fork` 来启动新应用,为每个进程创建完全随机化的地址空间,从而增强了 ASLR 的有效性。MTE 是一种 ARM 架构扩展,它通过为内存区域分配 4 位标签,并在每次访问时验证标签的正确性,来检测和阻止诸如越界读写和释放后使用等漏洞。 总的来说,Hardened Malloc 通过这些安全机制,显著提高了 GrapheneOS 的安全性,使其能够有效地防御各种内存损坏攻击。 由于没有评论内容,这里跳过评论分析。 - 原文: [Exploring GrapheneOS secure allocator: Hardened Malloc](https://www.synacktiv.com/en/publications/exploring-grapheneos-secure-allocator-hardened-malloc) - Hacker News: [https://news.ycombinator.com/item?id=45358216](https://news.ycombinator.com/item?id=45358216) - 作者: r4um - 评分: 42 - 评论数: 0 - 发布时间: 2025-09-24 17:56:04 --- ## 追踪旧金山停车执法人员的网站及其引发的讨论 这篇文章介绍了一个名为 "Find My Parking Cops" 的网站,该网站旨在展示旧金山停车执法人员的实时位置和开罚单情况,并提供了一个执法人员排行榜。该网站通过分析公开的城市数据,揭示了停车执法的模式和趋势。 文章提到,该网站在上线后不久,旧金山市政府就迅速更改了其网站,导致数据获取变得困难。尽管如此,该网站的作者还是通过逆向工程,找到了隐藏在罚单号码中的规律,并利用这个规律继续追踪执法数据。这个规律涉及到一个校验位的概念,通过对罚单号码进行简单的数学运算,可以验证其有效性。网站还提供了一些有趣的功能,例如执法人员排行榜,展示了开罚单最多的执法人员。 评论区对这个项目褒贬不一。有人赞赏这个项目的创意和技术,认为它能够帮助人们更好地了解停车执法情况。也有人批评该项目侵犯了执法人员的隐私,认为公开他们的实时位置可能会给他们带来安全风险。还有人提出了改进建议,例如增加时间区域设置,以及更长时间跨度的排行榜,以便更准确地反映执法人员的工作情况。此外,还有人分享了自己利用公共城市数据的经验,例如建立Airbnb房源的早期预警系统。总的来说,评论区对这个项目既有肯定,也有担忧,反映了人们对公共数据利用和隐私保护之间平衡的思考。 - 原文: [Find SF parking cops](https://walzr.com/sf-parking/) - Hacker News: [https://news.ycombinator.com/item?id=45350690](https://news.ycombinator.com/item?id=45350690) - 作者: alazsengul - 评分: 781 - 评论数: 423 - 发布时间: 2025-09-24 02:06:07 --- ## Libghostty 即将到来:打造通用终端模拟库 Mitchell 宣布正在开发的 Libghostty,目标是创建一个可嵌入的、功能完善、现代且快速的终端模拟库,解决现有终端模拟方案中存在的重复开发、不完整、有缺陷和速度慢的问题。 文章指出,许多应用程序,从通用终端模拟器到编辑器,甚至网站和应用,都在一定程度上实现了终端模拟,但大多是临时的、一次性的解决方案,没有使用任何共享库或代码库。终端模拟表面上看起来简单,但实际上充满了意想不到的复杂性和边缘情况,导致大多数实现不完整、有缺陷且速度慢。作者认为,对于 JetBrains、Visual Studio Code、GitHub、Vercel、Render 等公司来说,实现任何形式的终端模拟都是在浪费时间,如果他们能有一个稳定、可重用的解决方案,并且在任何地方都保持一致,那将对他们大有裨益。 Libghostty 的第一个库将是 `libghostty-vt`,这是一个零依赖(甚至不依赖 libc)的库,它提供了一个 API,用于解析终端序列并维护终端状态,例如光标位置、当前样式、文本换行等。解析终端序列是终端模拟器的最核心功能,从像 Ghostty 这样的完整终端模拟器到像 GitHub Actions 或 Vercel 构建输出这样的简单只读样式视图都需要它。`libghostty-vt` 从 Ghostty 中提取,并继承了所有实际优势:SIMD 优化解析、非常好的 Unicode 支持、高度优化的内存使用、强大的经过模糊测试和 Valgrind 测试的代码库、出色的功能兼容性,例如解析 Kitty Graphics Protocol 或 Tmux Control Mode 等。 作者计划将 `libghostty` 与 Ghostty 应用程序分开进行版本控制。目前已经发布了 Zig 模块,C API 也在开发中。长期来看,作者计划提供更多的 `libghostty-<x>` 库,以公开更多功能,例如输入处理、GPU 渲染、GTK 小部件和 Swift 框架等。这些库将构建为一个库系列,以最大限度地减少依赖项要求、代码大小和整体维护复杂性。 - 原文: [Libghostty is coming](https://mitchellh.com/writing/libghostty-is-coming) - Hacker News: [https://news.ycombinator.com/item?id=45347117](https://news.ycombinator.com/item?id=45347117) - 作者: kingori - 评分: 765 - 评论数: 239 - 发布时间: 2025-09-23 21:56:28 --- ## 《博德之门 3》Steam Deck 原生版本发布 Larian Studios 发布了《博德之门 3》的 Steam Deck 原生版本,旨在优化游戏在 Steam Deck 上的性能,减少 CPU 占用和内存消耗。如果你不确定是否安装成功,可以在 Steam 属性中强制使用 Linux Runtime 的 Steam Play 兼容性工具来更新游戏。 原生版本与 Proton 版本的区别在于,Proton 版本通过兼容层运行,需要额外的 CPU 处理能力。如果原生版本出现问题,可以按照步骤切换回 Proton 版本,选择 Proton 8 或更高版本即可。需要注意的是,Larian 不提供对 Linux 平台的直接支持,Steam Deck 原生版本仅在 Steam Deck 上提供支持。 游戏存档位置在原生版本和 Proton 版本中有所不同。原生版本的存档位于 `/home/deck/.local/share/Larian Studios/Baldur's Gate 3/PlayerProfiles/Public`,而 Proton 版本的存档位于 `/home/deck/.local/share/Steam/steamapps/compatdata/1086940/pfx/drive_c/users/steamuser/AppData/Local/Larian Studios/Baldur's Gate 3/PlayerProfiles/Public`。如果开启了 Steam 云存档,存档会自动同步到原生版本的存档文件夹。如果需要手动转移存档,可以通过桌面模式在两个文件夹之间复制粘贴。 关于 Mod,如果登录了 Larian 账户并连接到 mod.io,所有订阅的 Mod 将在切换到 Steam Deck 原生版本时自动下载。如果没有登录 Larian 账户,则需要手动从 Mod 管理器下载或从之前的文件夹手动转移 Mod。 评论区里,大家对 Larian 持续更新游戏表示赞赏,认为这是一个巨大的努力。有人分享了原生版本和 Proton 版本的性能基准测试,显示在第三幕中原生版本 FPS 大约提升了 10%。也有人指出,原生 Linux 版本的游戏通常存在 Bug,体验可能不如在 Proton 上运行的 Windows 版本。不过,也有玩家表示之前在 Steam Deck 上运行 BG3 体验不佳,希望原生版本能带来更好的游戏体验。总体来说,大家对 Larian 推出 Steam Deck 原生版本持积极态度,期待更好的游戏性能和体验。 - 原文: [Baldur's Gate 3 Steam Deck – Native Version](https://larian.com/support/faqs/steam-deck-native-version_121) - Hacker News: [https://news.ycombinator.com/item?id=45354644](https://news.ycombinator.com/item?id=45354644) - 作者: _JamesA_ - 评分: 550 - 评论数: 382 - 发布时间: 2025-09-24 08:26:59 --- ## Qwen3-VL 系列:更强大的视觉语言模型 Qwen 团队发布了全新的 Qwen3-VL 系列,号称是 Qwen 家族迄今为止最强大的视觉语言模型。这次更新在文本理解与生成、视觉内容感知与推理、更长上下文支持、空间关系和动态视频理解以及与 AI 代理交互等多个维度都取得了显著的进步。 Qwen3-VL 的目标不仅仅是“看到”图像或视频,而是真正理解世界、解释事件并采取行动。为了实现这一目标,团队系统地升级了关键功能,推动视觉模型从简单的“感知”转向更深层次的“认知”,从基本的“识别”转向高级的“推理和执行”。 Qwen3-VL 具备强大的视觉代理能力,可以操作计算机和移动界面,识别 GUI 元素,理解按钮功能,调用工具并完成任务。它在 OS World 等基准测试中取得了全球领先的性能,并且使用工具可以显著提高其在细粒度感知任务中的性能。 在文本方面,Qwen3-VL 采用文本和视觉模态的早期联合预训练,不断加强其语言能力。它在基于文本的任务上的表现与 Qwen3-235B-A22B-2507(旗舰语言模型)的表现相匹配,使其成为下一代视觉语言模型的真正“基于文本的多模态引擎”。 Qwen3-VL 还可以从图像或视频生成代码,例如将设计模型转换为 Draw.io、HTML、CSS 或 JavaScript 代码,从而使“所见即所得”的可视化编程成为现实。它还具有更好的空间理解能力,可以判断物体位置、视点变化和遮挡关系,并支持 3D 定位,为复杂的空间推理和具身 AI 应用奠定基础。 所有 Qwen3-VL 模型都原生支持 256K tokens 的上下文,可扩展至 100 万 tokens。这意味着可以输入数百页的技术文档、整本教科书,甚至两个小时的视频,模型将记住所有内容并准确检索细节,精确到视频中的具体秒数。 Qwen3-VL 的 Thinking 版本专为 STEM 和数学推理而优化。在面对复杂的学科问题时,它可以注意到细微的细节,逐步分解问题,分析因果关系,并给出基于逻辑和证据的答案。它在 MathVision、MMMU 和 MathVista 等推理基准测试中取得了出色的表现。 通过提高预训练数据的质量和多样性,Qwen3-VL 现在可以识别更广泛的物体,从名人、动漫人物、产品和地标,到动物和植物,涵盖日常生活和专业的“识别任何事物”的需求。OCR 现在支持 32 种语言(从 10 种增加),覆盖更多的国家和地区。在光线不足、模糊或倾斜文本等具有挑战性的真实条件下,它的表现更加可靠。稀有字符、古代文字和技术术语的识别准确率也得到了显著提高。它理解长文档和重建精细结构的能力得到了进一步增强。 在架构方面,Qwen3-VL 仍然采用原生动态分辨率设计,但团队在结构设计上进行了三方面的更新:采用了 Interleaved-MRoPE,引入了 DeepStack 技术来融合 ViT 的多层特征,并优化了视觉特征 Tokenization 策略。 - 原文: [Qwen3-VL](https://qwen.ai/blog?id=99f0335c4ad9ff6153e517418d48535ab6d8afef&from=research.latest-advancements-list) - Hacker News: [https://news.ycombinator.com/item?id=45352672](https://news.ycombinator.com/item?id=45352672) - 作者: natrys - 评分: 399 - 评论数: 130 - 发布时间: 2025-09-24 04:59:17 --- ## Test-Time Diffusion Deep Researcher (TTD-DR): 模仿人类研究方式的深度研究智能体 本文介绍了 Test-Time Diffusion Deep Researcher (TTD-DR),一种模仿人类研究方式的深度研究智能体。TTD-DR 通过扩散过程模拟研究报告的撰写,将粗糙的初稿逐步完善为高质量的最终版本。 TTD-DR 的核心在于两个新算法:组件级优化(通过自进化)和报告级改进(通过检索去噪)。自进化算法提升研究工作流程中每个步骤的质量,而检索去噪则利用新检索到的信息来修改和改进报告草稿。TTD-DR 的设计包含三个阶段:研究计划生成、迭代搜索和最终报告生成。研究计划生成阶段根据用户查询生成结构化的研究计划;迭代搜索阶段包含搜索问题生成和答案搜索两个子智能体,模拟检索增强生成 (RAG) 系统;最终报告生成阶段则整合所有收集到的信息,生成全面而连贯的最终报告。组件级的自进化算法旨在找到并保持高质量的上下文,通过初始状态的多样性、环境反馈的评估和修订、以及交叉融合的最终合并,不断提升每个阶段智能体的性能。报告级的检索去噪则利用搜索工具对初步的草稿进行去噪和演进,通过不断地检索新信息并将其用于修改报告草稿,逐步完善报告。 实验结果表明,TTD-DR 在长篇报告撰写和多跳推理任务上均取得了最先进的结果,尤其是在长篇研究报告生成任务上,相比 OpenAI Deep Research,TTD-DR 的胜率达到了 74.5%。此外,在需要大量搜索和推理的两个数据集上,TTD-DR 也优于 OpenAI DR。 (由于没有评论内容,跳过评论相关的输出。) - 原文: [Deep researcher with test-time diffusion](https://research.google/blog/deep-researcher-with-test-time-diffusion/) - Hacker News: [https://news.ycombinator.com/item?id=45314752](https://news.ycombinator.com/item?id=45314752) - 作者: simonpure - 评分: 64 - 评论数: 10 - 发布时间: 2025-09-21 00:26:53 --- ## 神经网络超采样技术:架构、训练与推理 本文深入探讨了Arm推出的神经网络超采样(NSS)技术,这是一种基于AI的下一代图像放大解决方案,旨在取代传统的启发式方法。文章详细介绍了NSS的架构、训练过程以及推理组件,为机器学习工程师和移动图形开发者提供了技术细节。 NSS的出现是为了解决传统时间超采样(TSS)中存在的诸如鬼影、遮挡伪影和时间不稳定等问题。TSS虽然在抗锯齿方面表现良好,但其依赖的手动调整启发式算法难以扩展,并且需要针对不同的内容进行持续调整。NSS通过利用AI技术,能够更好地处理这些问题,提供更稳定的图像质量。 NSS的训练过程包括生成高质量的训练数据、设计合适的神经网络架构以及优化训练参数。文章还讨论了如何在移动硬件上部署NSS,以及如何进行后处理和推理。 由于没有评论内容,这里省略评论分析部分。 - 原文: [How Neural Super Sampling Works: Architecture, Training, and Inference](https://semiengineering.com/how-neural-super-sampling-works-architecture-training-and-inference/) - Hacker News: [https://news.ycombinator.com/item?id=45318837](https://news.ycombinator.com/item?id=45318837) - 作者: PaulHoule - 评分: 14 - 评论数: 0 - 发布时间: 2025-09-21 08:12:00 --- ## 马尔可夫链:最初的语言模型 本文介绍了马尔可夫链,一种用于建模概率事件序列的数学工具,并探讨了其在文本自动补全中的应用。文章旨在帮助读者理解马尔可夫链的基本原理,并展示如何将其应用于实际的自然语言处理任务。 文章首先回顾了作者对当前AI炒作周期的四个阶段的思考,从最初的惊艳到最终的厌倦,从而引出对更基础技术的探索。随后,文章详细解释了马尔可夫链的概念,通过一个Alice在杂货店和天文馆之间移动的例子,生动地阐述了状态转移概率和矩阵表示。文章还介绍了如何使用矩阵运算来预测未来状态,并将其应用于文本补全。具体来说,文章描述了如何从文本中构建字典,并根据词语之间的转移频率构建转移矩阵。最后,通过将转移频率转化为概率,可以预测给定前一个词的情况下,最有可能出现的下一个词。 虽然文章没有直接的评论区内容,但我们可以设想一些可能出现的讨论点: 1. **效率问题:** 马尔可夫链在处理大规模文本时,转移矩阵会变得非常庞大,导致计算效率低下。因此,可以探讨如何优化存储和计算,例如使用稀疏矩阵或降维技术。 2. **上下文依赖:** 马尔可夫链只考虑前一个词,无法捕捉更长距离的上下文信息。可以讨论如何扩展马尔可夫链,例如使用更高阶的模型,或者结合其他技术,如神经网络,来提高文本补全的准确性。 3. **数据稀疏性:** 对于某些词语组合,训练数据中可能没有出现,导致转移概率为零。可以探讨如何解决数据稀疏性问题,例如使用平滑技术,或者从更大的语料库中获取数据。 4. **实际应用:** 除了文本补全,马尔可夫链还可以应用于哪些其他领域?例如,可以用于语音识别、基因序列分析、金融建模等。 总而言之,马尔可夫链作为一种经典的概率模型,在自然语言处理领域仍然具有一定的价值。通过深入理解其原理和局限性,我们可以更好地将其应用于实际问题,并不断探索新的改进方法。 - 原文: [Markov chains are the original language models](https://elijahpotter.dev/articles/markov_chains_are_the_original_language_models) - Hacker News: [https://news.ycombinator.com/item?id=45304980](https://news.ycombinator.com/item?id=45304980) - 作者: chilipepperhott - 评分: 425 - 评论数: 152 - 发布时间: 2025-09-20 02:42:21 --- ## 利用上下文工程让AI在复杂代码库中发挥作用 本文探讨了如何通过上下文工程,利用现有的AI模型在复杂的生产代码库中提高开发效率,即使面对大型代码库和复杂任务,也能让AI工具发挥积极作用。 文章指出,AI编码工具在处理实际生产代码库时面临挑战,尤其是在大型、已建立的代码库中,AI可能会降低开发人员的效率。然而,通过采用核心上下文工程原则,可以显著提升AI在编码方面的能力。作者通过实际案例,例如在30万行Rust代码库BAML上的实践,展示了如何通过“频繁有意压缩”技术,让AI在一天内完成原本需要一周的工作量,并保持代码质量。这种方法的核心在于围绕上下文管理设计整个开发过程,保持利用率在40-60%范围内,并在关键时刻加入高杠杆的人工审查。文章还提到了Sean Grove关于“规范即代码”的观点,以及Yegor关于AI工具在全新项目和复杂项目中的不同表现的研究,强调了上下文工程在充分利用现有AI模型方面的关键作用。作者认为,AI编码不仅仅适用于玩具项目和原型,而是一项需要深入技术工程的技能。 - 原文: [Getting AI to work in complex codebases](https://github.com/humanlayer/advanced-context-engineering-for-coding-agents/blob/main/ace-fca.md) - Hacker News: [https://news.ycombinator.com/item?id=45347532](https://news.ycombinator.com/item?id=45347532) - 作者: dhorthy - 评分: 438 - 评论数: 366 - 发布时间: 2025-09-23 22:27:36 --- ## 2025年顶级编程语言趋势分析:AI 影响下的语言选择 这篇文章探讨了在 AI 辅助编程日益普及的背景下,编程语言的未来趋势。文章指出,由于程序员越来越依赖 AI 工具,他们对特定编程语言的关注可能会降低。 文章的核心观点是,传统的编程语言流行度衡量标准正变得越来越不可靠。 过去,通过公开渠道(如 Stack Overflow、GitHub 等)追踪程序员的兴趣,可以相对准确地评估语言的受欢迎程度。 然而,现在程序员更多地转向私有化的 AI 助手,例如 Claude 或 ChatGPT,来解决编程问题,这导致公开数据源的信息量减少。 此外,AI 辅助编程的兴起也改变了程序员对语言选择的态度。 过去,选择合适的语言对于解决特定问题至关重要。 但现在,AI 可以帮助程序员用任何语言编写代码,使得语言本身的重要性降低。 就像今天的开发者不太关心 CPU 的指令集一样,未来他们可能也不会太在意代码是用哪种语言编写的。 文章还预测,这种趋势可能会对新语言的出现产生不利影响。 过去,新语言可以通过演示、教程和示例代码来吸引开发者。 但现在,AI 需要大量的训练数据才能有效地支持一种语言,这使得新语言更难获得足够的关注和支持。 总而言之,文章认为 AI 正在重塑编程领域,并可能导致编程语言的流行度变得不再重要。 虽然仍会有人关注特定语言的优缺点,但总体而言,语言选择可能会成为一个相对次要的问题。 - 原文: [Top Programming Languages 2025](https://spectrum.ieee.org/top-programming-languages-2025) - Hacker News: [https://news.ycombinator.com/item?id=45354314](https://news.ycombinator.com/item?id=45354314) - 作者: jnord - 评分: 225 - 评论数: 348 - 发布时间: 2025-09-24 07:42:50 --- ## Autodesk APS 云 API 新商业模式及定价调整 Autodesk 将于年底推出 Autodesk Platform Services (APS) 云 API 的新商业模式,旨在提供更灵活、可预测的访问方式,方便开发者规划项目。这一变化将影响所有 APS API 用户和开发者,需要采取关键步骤以适应过渡。 新模式围绕三大核心优势构建:可访问性,允许开发者在每月使用量限制内试验 API;灵活性,提供与使用量相符的支付选项;创新性,为 Agentic AI 和模型上下文协议服务器 (MCP) 奠定基础。新模式采用简单的双层结构:免费层和付费层。免费层提供对云 API 的每月访问权限,适合测试、学习和构建概念验证,以及产品订阅用户访问其产品 API。付费层则提供两种支付选项:预付(使用 Flex 代币)和按需付费。预付方式类似于当前的 Flex 模式,提前购买代币支付 API 使用量,提供预算可控性。按需付费则无需预先承诺,根据实际使用量按月计费。 为了继续使用 APS API,用户需要在新模式启动后两周内完成两项关键操作:选择免费或付费方案,并将应用程序迁移到开发者中心。如果未完成这些步骤,API 访问权限将被暂停。Autodesk 还将停止接受云积分作为支付方式,正式过渡到 Flex 代币。 此次调整中,Automation API、Model Derivative API、Flow Graph Engine API 和 Reality Capture API 将被评级,即每月的使用量有限制。Model Derivative API 和 Automation API for Revit、AutoCAD 和 Inventor 的定价将上涨,部分之前免费的活动现在将被收费。其他 APS API 在 12 月的发布中将不被评级(免费使用)。 为确保平稳过渡,Autodesk 建议用户提前购买 Flex 代币,并将应用程序迁移到开发者中心。Autodesk 提供了多种支持资源,包括文档、GitHub 仓库和 Stack Overflow 资源。Autodesk Developer Network (ADN) 成员还可以通过其会员资格获得一对一的支持。Autodesk 还将举办网络研讨会,详细介绍这些变化并解答疑问。 - 原文: [Autodesk Increases APS Pricing](https://aps.autodesk.com/blog/aps-business-model-evolution) - Hacker News: [https://news.ycombinator.com/item?id=45359915](https://news.ycombinator.com/item?id=45359915) - 作者: nsoonhui - 评分: 5 - 评论数: 1 - 发布时间: 2025-09-24 21:18:44 --- ## 研究揭示生物死亡时会发出可见光 一项新的研究表明,动植物在死亡时会发出一种可见光,并在死亡后消失。这项研究通过高灵敏度的设备,捕捉到了生物体在生命终结时发出的微弱光芒,引发了科学界的广泛关注。 这项研究的核心在于观察活体和死亡生物体在相同温度下的可见光波长发射差异。研究人员特别强调,这种光并非简单的热辐射,而是一种独特的生物发光现象。他们使用先进的成像技术,捕捉到了活体小鼠和植物在受到压力时发出的超弱光子,并在它们死亡后观察到这种光芒的迅速消失。研究范围涵盖了200-1000纳米的光谱范围,包括紫外线、可见光和近红外线。 研究人员推测,这种光可能与生物体的代谢或信号传导有关,尤其是在应激状态下。他们还指出,紫外线和可见光可能对神经刺激、伤口愈合和癌症治疗产生光刺激和光生物调节效应。这项发现为我们理解生命过程和死亡机制提供了新的视角,并可能在医学诊断和治疗领域带来潜在的应用。 评论区里,大家对这项研究提出了各种有趣的观点和疑问。有人指出,这项研究并非首次发现生物发光现象,之前的研究也曾观察到类似现象。有人对“死亡”的定义提出了疑问,认为死亡是一个渐进的过程,好奇这种光芒会在哪个时间点停止发射。还有人猜测,这种光可能与生物体内的能量释放有关,随着设备灵敏度的提高,我们能观察到更多类似的现象。此外,还有人联想到科幻作品中的生命探测技术,认为这项研究为未来的生命体扫描技术提供了可能性。 - 原文: [New study shows plants and animals emit a visible light that expires at death](https://pubs.acs.org/doi/10.1021/acs.jpclett.4c03546) - Hacker News: [https://news.ycombinator.com/item?id=45355965](https://news.ycombinator.com/item?id=45355965) - 作者: ivewonyoung - 评分: 156 - 评论数: 126 - 发布时间: 2025-09-24 11:27:41 ---

  

🫵 来啊,说点有用的废话!