【HN中文日报】AI、安全、怀旧齐飞!2025 最新科技热点一网打尽,速来围观!

意外富翁 · 4个月前 · News · 23 · 0

今天 Hacker News 社区聊了啥? NO.20250822

这期日报内容超丰富!从 DeepSeek 最新 AI 模型 V3.1 发布,到 AI 攻击新手法曝光,再到 AWS CEO 怒怼 AI 替代初级员工,AI 话题热度爆表!还有复古情怀的 OS X Mavericks 怀旧之旅和 VHS-C 技术解析。想了解零系统调用 HTTPS 服务器如何用 Rust 实现?想知道如何识别假冒 SSD?别错过这期日报,带你快速get最新科技动态,绝对有料!

Hacker News 中文精选


Thunderbird Pro 2025年8月更新:邮件服务、日程安排和文件共享

Thunderbird Pro 在2025年8月发布更新,介绍了其订阅服务的最新进展,包括Thundermail邮件服务、Appointment日程安排工具和Send加密文件共享工具。这些服务旨在增强 Thunderbird 的功能,为需要额外功能的用户提供更高效的体验,并且都是开源的。

Thundermail 邮件服务将支持 IMAP、SMTP 和 JMAP 协议,兼容 Thunderbird 和其他邮件客户端。用户可以使用自己的域名,也可以选择 Thunderbird 提供的 @thundermail.com 或 @tb.pro 域名。服务器最初位于德国,未来将扩展到更多国家。

Appointment 日程安排工具将紧密集成到 Thunderbird 应用中,允许用户在撰写邮件时直接插入日程安排链接。该工具支持自托管,并可根据用户需求进行定制。未来还将支持 Zoom 会议、电话会议和线下会面等多种会议类型,并提供群组日程安排功能。

Send 加密文件共享工具基于 Thunderbird 的 Filelink 功能构建,支持大文件传输,并提供 500GB 的存储空间。该工具将作为系统插件发布,以便更快地推送更新,并避免受 Thunderbird 主要版本发布周期的限制。

Thunderbird 还在探索其他 Pro 功能,例如基于 Markdown 的笔记功能,以及协作文档和电子表格。此外,之前宣布的 Assist 服务(利用 AI 功能辅助邮件任务)仍在研发阶段。Thunderbird 正在与 Thunderbird Council 合作制定公开路线图,以提高透明度并鼓励社区协作。

这些订阅服务不会影响免费的 Thunderbird 桌面和移动应用的功能和稳定性。收费是为了确保使用这些工具的用户能够帮助支付成本,而不是完全依赖捐赠。Thunderbird Pro 是一套可选的开源服务,旨在增强 Thunderbird 应用的功能,而不是取代它们。

评论区普遍对 Thunderbird Pro 的收费模式表示理解和支持,认为这是资助开源项目的好方法。用户希望这些服务能够顺利发展,并为 Thunderbird 项目提供资金支持。同时,也有用户希望自托管能够尽可能方便。


使用 io_uring, kTLS 和 Rust 构建零系统调用 HTTPS 服务器

本文介绍了如何利用 io_uring, kTLS 和 Rust 构建一个高性能的 HTTPS 服务器,目标是尽可能减少甚至消除每个请求的系统调用,从而提高服务器的吞吐量和效率。文章首先回顾了 Web 服务器的发展历程,从 pre-forking 到 select/poll,再到 epoll,逐步减少了系统调用的开销。

文章重点介绍了 io_uring 的优势,它允许 Web 服务器将操作指令写入队列,由内核异步处理,避免了频繁的系统调用。通过将 accept() 等操作放入队列,服务器可以异步地处理连接请求,并在完成队列中获取结果。为了避免忙循环,内核和 Web 服务器都会在检查队列时进行短暂的忙循环,如果没有新事件则进入睡眠状态,并通过系统调用唤醒。

文章还提到了单线程 per core 的架构,以及 NUMA 硬件的优化,每个线程绑定到一个核心,并只访问本地 NUMA 节点的内存,以减少跨 NUMA 节点的访问延迟。此外,文章还讨论了内存分配的问题,建议为每个连接预先分配固定大小的内存块,避免频繁的内存分配和碎片化。

kTLS 允许应用程序将加密/解密任务交给内核处理,从而可以利用 sendfile() 避免用户空间和内核空间之间的数据拷贝,并且可以将加密操作卸载到网卡硬件上。文章还提到了 descriptorless files,通过 register_files 避免了用户空间和内核空间之间传递文件描述符的开销。

最后,作者分享了自己使用 Rust, io_uring 和 kTLS 构建的 Web 服务器 tarweb,它可以服务于单个 tar 文件的内容,并且在每个请求的基础上不产生任何系统调用。虽然 tarweb 还不完善,但它验证了这种技术的潜力。作者提到在使用 io_uring 和 kTLS 时遇到了一些兼容性问题,并通过提交 PR 解决了这些问题。文章最后提到,作者尚未进行基准测试,计划在清理代码后进行。


Inconvo:面向客户分析的 AI Agent

Inconvo 是一款旨在帮助客户进行数据分析的 AI Agent,它通过自然语言交互,让用户更轻松地从数据中获取洞见。这款工具特别强调面向客户的分析场景,旨在简化数据探索过程。

Inconvo 提供了两种使用方式,用户可以通过 URL 或搜索查询来与 AI Agent 交互。它能够理解用户的自然语言问题,并将其转化为对底层数据的查询,最终将结果以易于理解的方式呈现给用户。虽然目前的产品描述中没有明确提到对时间序列数据趋势分析的支持,但考虑到数据分析的广泛需求,未来可能会加入相关功能。

评论区中,用户主要关注 Inconvo 的功能扩展和安全性问题。有人询问是否支持时间序列分析,这表明用户对 Inconvo 在趋势预测方面的潜力感兴趣。此外,关于组织 ID 在 LLM 追踪中的处理方式,引发了对安全性的担忧,用户担心提示注入可能导致的安全风险。同时,也有用户询问是否支持 Google Sheets 和 ClickHouse 等数据源,表明用户希望 Inconvo 能够连接更多样化的数据平台。这些问题反映了用户对 Inconvo 功能完善程度和数据连接能力的期待。


LabPlot:免费开源的跨平台数据可视化与分析工具

LabPlot 是一款免费、开源且跨平台的数据可视化和分析软件,它旨在为所有人提供易于访问且功能强大的工具,并受到专业人士的信赖。 该软件提供高质量的数据可视化和交互式绘图功能,只需点击几下即可完成。它还提供可靠且简单的数据分析、统计、回归、曲线和峰值拟合功能。

LabPlot 支持使用 Python、R、Julia 等语言的交互式笔记本,从而实现直观快速的计算。它还具备便捷的数据提取(plot digitizer)功能,并支持实时数据。用户可以轻松地将数据导入和导出为多种格式。LabPlot 适用于 Windows、macOS、Linux、FreeBSD 和 Haiku 等操作系统。

该软件的最新版本包括 2.11、2.12 和 2.12.1,每个版本都带来了新的特性、改进和性能增强。例如,LabPlot 2.11 引入了对更多数据格式和可视化类型的支持。LabPlot 2.12 则引入了大量新功能,使其成为一个强大的数据分析工具。此外,LabPlot 还获得了 NLnet 的 NGI Zero Core 基金的资助。

LabPlot 持续更新其用户文档,以帮助用户更好地使用该软件。该项目鼓励用户参与贡献,并提供多种支持方式,包括论坛、邮件列表等。

由于文章中没有评论内容,因此无法进行评论分析。


DeepSeek 发布 V3.1 版本:迈向 Agent 时代

DeepSeek 推出了 V3.1 版本,这是一个混合推理模型,支持思考和非思考两种模式,旨在提升工具使用和多步骤 Agent 任务的能力。新版本在推理速度和效率上有所提升,并支持 Anthropic API 格式和严格的 Function Calling。

DeepSeek V3.1 的主要更新包括:混合推理模式,可以在思考和非思考模式间切换;更快的推理速度,尤其是在思考模式下;更强的 Agent 技能,通过后训练提升工具使用能力;API 更新,包括 deepseek-chat (非思考模式) 和 deepseek-reasoner (思考模式),都支持 128K 上下文;支持 Anthropic API 格式和严格的 Function Calling;工具和 Agent 能力升级,在 SWE 和 Terminal-Bench 上表现更好,增强了复杂搜索任务的多步骤推理能力;模型更新,V3.1 基于 840B tokens 持续预训练,扩展了长上下文,并更新了 tokenizer 和 chat 模板;开源了 V3.1 Base 和 V3.1 的权重。同时,官方也公布了新的定价方案,将于 2025 年 9 月 5 日生效。

评论区里,大家对 DeepSeek V3.1 的评价褒贬不一。有人分享了本地运行 GGUF 模型的经验,并提供了优化参数的链接。也有人贴出了 Terminal-Bench 的排行榜,指出 V3.1 在某些基准测试中不如 GPT-5、Claude 4 和 GLM-4.5,但与其他开源模型相比表现尚可。

一些用户认为 V3.1 的智能水平与 gpt-oss-120B 相当,但速度较慢且成本较高。还有人注意到,chat.deepseek.com 会在回复中频繁使用 "Of course.",怀疑是后端注入以增强顺从性。另外,有用户发现 V3.1 在使用非正式用语时会将其加上引号,类似于 Gemini 的行为,并推测其可能使用了大量的 Gemini 数据进行训练。

也有用户赞赏 DeepSeek 推出与 Anthropic 兼容的 API,认为这是一个明智之举。不过,也有用户反映 V3.1 存在较多的幻觉问题。还有用户抱怨模型输出过于冗长,需要不断要求其更简洁。总的来说,DeepSeek V3.1 的发布引发了广泛关注,用户对其性能、定价和实际应用效果都有不同的看法。


使用 rel="share-url" 暴露分享意图的提案

这篇文章探讨了使用 rel="share-url" 来标准化网页分享意图的方法,旨在解决不同社交平台分享链接方式不统一的问题。作者 Terence Eden 提出了一个巧妙的解决方案,通过在 HTML 中使用 <link rel="share-url" href="..."> 标签,让网站能够更清晰地向外部应用暴露其分享接口。

目前,各个社交网站的分享链接格式各不相同,有的接受 URL 和标题,有的只接受 URL,还有的只接受纯文本。为了解决这种混乱,Ben Werdmuller 提出了 "Share Openly" 倡议。该倡议建议网站使用 <link rel="share-url" 标签,并用 {url}{text} 占位符来表示 URL 和分享文本,从而让 ShareOpenly 能够更好地适配各种平台。例如,对于接受 URL 和标题的网站,可以使用 <link rel="share-url" href="https://www.facebook.com/sharer.php?u={url}&t={text}">。对于只接受 URL 的网站,可以使用 <link rel="share-url" href="https://www.linkedin.com/sharing/share-offsite/?url={url}">

对于像 Mastodon 和 BlueSky 这样只接受文本分享的平台,可以使用 <link rel="share-url" href="https://bsky.app/intent/compose?text={text}">,或者将 URL 附加到文本中,例如 <link rel="share-url" href="https://mastodon.social/share?text={text}%0A{url}">。作者认为这是一个不错的解决方案,并提出了三个问题:是否认为 <link rel="share-url" 是一个好主意?对该提案有什么修改建议?是否愿意使用它?

评论区观点分析

评论区中,Vale 分享了一个几年前关于人们是否使用分享按钮的调查,为讨论增加了一个有趣的视角。虽然只有一个评论,但它引发了关于分享按钮实际使用情况的思考,这对于评估 rel="share-url" 的价值至关重要。如果用户很少使用分享按钮,那么标准化分享意图的意义可能会降低。


探讨“万物互联”:统计学、心理学视角下的关联性

本文深入探讨了一个有趣的现象:在现实世界的数据集中,几乎所有变量之间都存在非零相关性,即使它们看起来完全独立。这种现象对统计理论,特别是零假设检验,提出了严峻的挑战。

文章指出,统计学和心理学中流传着一种观点,认为“万物皆相关”。这意味着,在任何实际数据集中,变量之间或多或少都存在关联,而这种关联并非仅仅是抽样误差造成的。即使在看似独立的变量之间,也可能存在显著的相关性。这种现象有很多别称,比如“垃圾因素”、“零假设总是错误的”等等。

这种普遍相关性的存在,对传统的零假设显著性检验提出了质疑。如果所有变量都或多或少相关,那么随着数据量的增加,零假设(即变量之间没有关系)几乎总是会被拒绝。这意味着,未能拒绝零假设仅仅表明数据不足,而不能真正证实某个理论。

文章进一步解释了这种现象背后的原因。首先,从算术的角度来看,某些关系精确地为零的可能性极小。其次,现实世界的属性和特征通过无数的因果网络、动态和潜在变量相互连接,例如影响所有人类特征的遗传相关性,这些都会在看似独立的变量之间产生真正的相关性,而且这些相关性的规模可能出乎意料地大且重要。

为了验证这一观点,文章还通过 R 语言进行了一项蒙特卡洛模拟。模拟结果表明,即使在完全不相关的随机变量中,也会出现一定程度的相关性。虽然大多数相关性接近于零,但仍然有一些相关性超过了设定的阈值。

总而言之,这篇文章挑战了我们对变量独立性的传统认知,并提醒我们在进行统计分析时,要考虑到现实世界中普遍存在的相关性。


管理者必备技能:勇于承认并弥补错误

这篇文章探讨了管理者经常被忽视的一项重要技能:承认并弥补错误。文章指出,管理者犯错是不可避免的,关键在于犯错后的处理方式,即真诚地承认错误、承担责任并积极弥补,这比追求完美更重要。

文章强调,糟糕的管理者并非犯错最多的人,而是那些从不承认错误、文过饰非的人。作者分享了一个常见场景:管理者未与团队协商就做出承诺,导致团队加班加点完成任务,此时,管理者是否承认错误将直接影响团队的信任和士气。勇于承认错误的管理者能够赢得团队的尊重和信任,而逃避责任则会导致人才流失。

文章给出了弥补错误的具体步骤:明确指出错误,避免含糊其辞;不要为自己辩解,关注对他人造成的影响;切实改变行为,避免重蹈覆辙;给予足够的时间,修复信任需要持续的努力。作者认为,勇于弥补错误能让管理者更加自信,敢于决策、进行艰难的对话和承担合理的风险,从而摆脱完美主义的束缚。

文章也提醒读者,承认错误并非为糟糕的管理开脱,而是接受人性的不完美,并以此为契机不断学习和成长。管理者的职责是交付有价值的软件、帮助团队成长并创造良好的工作环境,而勇于承认错误是实现这些目标的重要保障。

评论区也对此话题展开了热烈讨论,观点如下:

  • 问责制的重要性: 有评论指出,管理者不仅要道歉,更要建立相应的制度,防止类似错误再次发生,这才是真正的负责任。
  • 管理方法分享: 有评论分享了 "Mochary Method" 这一管理方法,其中详细介绍了如何应对错误,并提倡 "rewind and redo" 的原则。
  • 人际关系建立: 有评论者从教师的角度指出,承认错误有助于建立更牢固的人际关系,打破 "领导者永远正确" 的刻板印象。
  • 团队目标至上: 也有评论认为,管理者应该将重点放在团队目标上,而不是过度关注道歉的方式。

总而言之,这篇文章引发了关于管理者如何有效处理错误的深入思考,强调了真诚、责任和持续改进的重要性。


用手机控制购物车轮子:一个有趣的破解项目

这个项目展示了一种利用手机扬声器发出的音频信号来控制购物车轮子的锁定和解锁机制的方法。通过播放特定的 7.8 kHz 音频文件,可以模拟管理遥控器的信号,从而影响 Gatekeeper Systems 轮子的工作状态。

文章解释说,许多电子购物车轮子通过地下电线发出的 7.8 kHz 信号来判断何时锁定和解锁。作者发现可以使用手机扬声器产生的寄生电磁场来“传输”类似的信号。这个想法源于作者在 DEFCON 29 上的演讲,展示了一种低成本、非传统的破解方式。这个项目利用了音频范围内的频率,使得普通手机也能成为控制工具。这种破解方式的实现,为我们提供了一个独特的视角,让我们了解到一些看似普通的设备,也可能存在安全漏洞。

评论区对这个项目表现出了浓厚的兴趣,同时也提出了各种问题和看法。

  • 地域差异: 有人指出,在荷兰等国家,锁定购物车轮子并不常见,这引发了关于这种系统在不同地区适用性的讨论。

  • 意外后果: 评论中提到了锁定购物车可能导致的意外问题,例如轮子磨损,影响使用体验。

  • 黑客精神: 有评论者赞扬了这个项目所体现的黑客精神,认为它与 LoLRa 项目有相似之处,都是在没有专用硬件的情况下实现特定功能。

  • 安全风险: 有人指出,文章中使用的计数器服务可能存在恶意软件风险,提醒读者注意网络安全。

  • 应用场景: 评论中还提到了移动人行道上锁定购物车的情况,并猜测可能使用了类似的机制。

  • 个人经历: 有人分享了因购物车轮子锁定而导致的不愉快经历,表达了对这种系统的不满。

总的来说,评论区对这个项目既有赞赏,也有质疑,同时也引发了关于技术应用、安全风险和社会影响的思考。


uv 集成代码格式化功能:实验性探索

这篇文章介绍了 uv 工具链中新增的 uv format 命令,它允许开发者使用 Ruff 格式化 Python 代码。目前该功能还处于实验性阶段,但已经可以体验。

uv format 的核心是集成了 Ruff,一个速度极快的 Python 代码格式化工具。通过 uv format,开发者可以直接使用 uv 来格式化代码,无需单独安装和配置 Ruff。要开始使用,首先需要安装 uv。安装完成后,就可以在项目中使用 uv format 命令来格式化代码了。例如,uv format . 可以格式化当前目录下的所有 Python 文件。

此外,uv format 还允许开发者通过命令行参数将配置传递给 Ruff。这意味着你可以自定义 Ruff 的行为,例如指定要使用的代码风格或忽略特定的文件。总的来说,uv format 的加入,使得 uv 成为一个更加全面的 Python 工具链,简化了代码格式化的流程。


Go 语言的缺陷:为何它仍然不尽如人意

本文作者批判了 Go 语言中一些令人困扰的设计选择,例如错误变量的作用域、两种类型的 nil、缺乏可移植性、append 函数的非预期行为、以及 defer 机制的笨拙。作者认为,这些问题并非不可避免,而是由于设计时考虑不周或缺乏实际经验所致。

作者首先指出 Go 强制错误变量的作用域过大,导致代码可读性降低,增加了潜在的 bug 风险。接着,他批评 Go 存在两种类型的 nil,这使得代码更加混乱,容易出错。此外,作者认为 Go 的可移植性设计存在缺陷,需要在文件顶部添加注释来进行条件编译,这是一种过时且容易出错的做法。

append 函数的行为也受到了批评,因为它可能在无意中修改底层数组,导致难以预测的结果。defer 机制被指责为笨拙,因为它迫使开发者手动管理资源的释放,而不是像 RAII 那样自动进行。更糟糕的是,标准库会吞掉异常,使得编写异常安全的代码变得更加困难。即使开发者编写了 defer 语句来释放资源,如果发生 panic 并且被标准库捕获,资源可能无法正确释放,导致程序状态不一致。作者认为,这些设计缺陷使得 Go 语言在实践中难以使用,并降低了开发效率。

由于没有评论内容,这里省略了评论分析。


VHS-C:一个“懒惰”的想法如何走向完美

这期 Technology Connections 的视频深入探讨了 VHS-C 这种录像带格式,分析了它在技术上的妥协与巧妙之处。视频主要讲述了 VHS-C 格式诞生的背景,它如何通过简单的“懒惰”设计,实现了与 VHS 录像机的兼容,从而在市场上获得了一席之地。

视频详细介绍了 VHS-C 的设计原理,即通过将标准的 VHS 录像带缩小尺寸,并将其封装在一个特殊的卡匣中。这个卡匣可以通过适配器,直接在标准的 VHS 录像机上播放。这种设计避免了重新设计整个录像机系统的复杂性,降低了生产成本,也方便了用户。视频还对比了 VHS-C 与其他同期的录像带格式,例如 8mm 和 Hi8,指出 VHS-C 在兼容性上的优势。尽管在画质和录制时间上存在一些妥协,但 VHS-C 凭借其便利性和兼容性,成功地占领了一部分市场。视频也探讨了当时的市场环境,以及消费者对于便携式摄像机的需求。VHS-C 的出现,正好满足了这一需求,让人们可以更方便地拍摄和分享家庭录像。

评论区里,大家对 VHS-C 充满了回忆。有人提到,这种格式让他们想起了小时候用摄像机拍摄家庭录像的时光,满满的都是怀旧感。也有人评论说,VHS-C 的成功,很大程度上归功于它的兼容性,这在当时是一个非常重要的优势。还有人调侃说,现在手机越来越薄,电池越来越不耐用,这和当年 VHS-C 为了便携性而牺牲画质有点类似。一位在 90 年代 K-Mart 电子部门工作过的朋友分享了他的经历,很多人买了 VHS-C 适配器后,不明白为什么不能直接在 VCR 上播放,闹出了不少笑话。总的来说,评论区里充满了对 VHS-C 的回忆和讨论,大家从不同的角度分析了它的成功和不足。


SVG Path 交互指南:掌握矢量图形的绘制

本文深入探讨了 SVG <path> 元素,揭示了如何使用它来创建各种形状,包括直线、曲线和弧线。文章旨在帮助开发者理解 <path> 的基本概念和命令,从而更有效地利用 SVG 进行图形设计。

文章首先介绍了 <path> 元素的基本思想,它类似于矢量图形软件中的“钢笔”工具,通过一系列绘图指令来创建形状。d 属性用于定义这些指令,例如 M 命令用于移动画笔到指定位置,L 命令用于绘制直线。关键在于理解指令的连续性,每个指令都依赖于前一个指令的结束位置。

接下来,文章详细讲解了各种 <path> 命令,包括:

  • Move (M):将画笔移动到指定坐标,不绘制任何东西,是每个 path 命令的起点。
  • Lines (L):绘制直线,需要指定终点坐标。
  • Bézier curves (Q/C):绘制贝塞尔曲线,分为二次贝塞尔曲线 (Q) 和三次贝塞尔曲线 (C),分别使用一个和两个控制点来调整曲线的形状。三次贝塞尔曲线比二次贝塞尔曲线拥有更强的控制能力,可以创建更复杂的曲线形状。
  • Arcs (A):绘制椭圆弧,参数较多,理解起来比较复杂。它允许在起点和终点之间绘制椭圆曲线的一部分。

文章通过交互式示例,帮助读者直观地理解每个命令的作用和参数。特别是在讲解弧线命令时,作者建议先理解其背后的高层概念,再深入研究具体的语法,从而更容易掌握。

总而言之,<path> 元素是 SVG 中最强大的工具之一,掌握它可以创建几乎任何矢量图形。虽然学习曲线可能比较陡峭,但通过本文的指导和实践,开发者可以逐步掌握其精髓,并将其应用到实际项目中。


警惕!图像缩放竟成AI攻击武器

本文揭示了一种新型攻击方式,攻击者利用图像缩放技术,在AI系统处理图像时植入恶意指令,从而实现数据泄露等恶意行为。这种攻击手段隐蔽性强,对AI安全构成严重威胁。

文章指出,攻击者可以构造一种特殊的图像,该图像在原始分辨率下看起来无害,但经过AI系统缩放后,会显现出隐藏的prompt注入。这种注入可以欺骗AI系统执行恶意操作,例如将用户数据发送给攻击者。文章重点介绍了针对Google Gemini CLI的数据泄露攻击案例,攻击者通过上传看似正常的图像,诱使Gemini CLI在用户不知情的情况下,将Google Calendar中的数据泄露到攻击者的邮箱。

此外,文章还展示了在Vertex AI Studio、Gemini的Web界面和API、Google Assistant以及Genspark等多个平台上的成功攻击案例,表明这种攻击方式具有广泛的适用性。文章深入探讨了图像缩放算法的原理,指出不同的缩放算法(如最近邻插值、双线性插值和双三次插值)对攻击方式有不同的要求。攻击者需要对目标系统的缩放算法进行指纹识别,才能选择合适的攻击策略。文章还介绍了Trail of Bits开发的开源工具Anamorpher,可以帮助安全研究人员探索和生成此类恶意图像。

文章强调,AI系统在处理图像时,应采取适当的安全措施,例如对上传的图像进行安全检查,避免在缩放过程中引入恶意指令。同时,开发者也应加强对图像缩放算法的安全性研究,开发更加安全的图像处理技术。


如何避免购买到假冒 SSD 固态硬盘

本文作者分享了自己购买到假冒 Kingston SSD 的经历,提醒大家在购买存储设备时要格外小心,即使是从大型电商平台购买,也要注意供货商的信誉。

作者满怀希望地为他的 2006 年 iMac 更换了 SSD,但却发现传输速度慢得出奇,甚至比 USB 2.0 还慢。一开始他怀疑是 SATA 转 USB 适配器的问题,但经过测试后,他开始怀疑这块 SSD 本身就是假的。虽然包装看起来很正规,也有 Kingston 的标志和防伪标签,但种种迹象表明这很可能是一个被篡改过的 128GB SSD,冒充 960GB 出售。为了验证这一猜想,作者使用了 F3 (Fight Flash Fraud) 工具进行读写测试,结果 SSD 彻底报废,甚至无法格式化。

作者联系了电商平台 eMag,并得到了退款。他提醒大家,即使在大型电商平台购买商品,也要仔细检查供货商的信誉,避免落入 "fulfilled by Amazon" 类似的陷阱。此外,作者还提到,他购买的商品页面在事后被篡改成了完全不同的产品,这使得退货流程变得更加复杂。最后,作者建议大家从信誉良好的渠道购买存储设备,并分享了通过观察产品细节来识别假冒产品的经验。比如,假冒产品的背面标签印刷质量通常很差。

评论区里,大家也分享了各自的经验和看法:

  • 电商平台信誉问题: 有人指出,早期大家信任亚马逊是因为小零售商信誉难以保证,但现在情况反过来了,大型平台上的 "sku-pooling" 机制使得消费者无法得知商品的真正来源,导致假冒伪劣产品泛滥。因此,现在他们更倾向于在本地专卖店购买商品。
  • 存储设备造假普遍: 评论中提到,现在购买存储设备需要格外小心,即使是从亚马逊购买,也可能买到被篡改 SMART 数据的假冒 HDD。
  • Kingston A400 系列问题: 有人指出,Kingston A400 系列 SSD 本身就存在固件缺陷,可能导致类似作者遇到的问题,建议购买后及时更新固件。
  • eBay 上的假冒 SSD: 有人指出,eBay 上充斥着各种假冒 SSD,它们通常伪装成 WD 或三星的产品,但内部只有很小的存储空间,并通过修改固件来虚报容量。一旦写入数据超过实际容量,就会彻底损坏。

总而言之,购买存储设备时务必擦亮眼睛,选择信誉良好的商家,并仔细检查产品细节,避免上当受骗。


AI 的“自信错误”是发展瓶颈

本文探讨了人工智能(AI)领域中“自信错误”的问题,并认为这是阻碍 AI 广泛应用的关键因素。文章指出,AI 的不准确性会导致验证成本增加、信任度下降,并阻碍改进的动力。

文章首先指出,AI 即使只有很小的错误率,也会对实际应用产生重大影响。例如,在包含十个步骤的工作流程中,即使 AI 的准确率达到 90%,也意味着每三个工作流程中就有两个存在错误。这种不确定性导致用户需要花费大量时间来验证 AI 的输出,从而降低了投资回报率。此外,一次严重的错误可能会抵消多次成功带来的信任,导致用户放弃使用 AI 系统。更糟糕的是,如果无法确定 AI 犯错的原因,就很难进行改进,从而扼杀了进一步发展的动力。

文章接着提出,解决“自信错误”的关键在于让 AI 能够识别并报告其不确定性。一个理想的解决方案是建立一个“准确性飞轮”,在这个飞轮中,AI 首先能够识别自身的不确定性,并向用户发出信号。然后,用户可以提供反馈,帮助 AI 弥补知识上的不足。最后,AI 可以从这些反馈中学习,提高其准确性。文章还强调,实现这一目标需要解决数据质量、数据时效性以及程序语义等方面的问题。

文章最后提供了一个快速诊断 AI 投资的方法:在投资“AI for X”项目之前,应该询问该系统是否能够识别自身的不确定性,以及是否能够从用户的反馈中学习。

评论区 lucideer 指出,文章将问题归结为“唯一的问题”有些过于简单化,低估了解决该问题的难度。此外,lucideer 还提到,聊天 LLM 容易根据用户引导进行“纠正”,这可能会导致 AI 以一种用户更容易接受的方式“自信地犯错”。


Python 模式匹配的奇技淫巧:抽象基类 (ABC) 的妙用

本文深入探讨了 Python 中抽象基类 (ABC) 与模式匹配结合使用时的一些有趣特性,展示了如何利用 __subclasshook__ 来定制类型判断逻辑,甚至实现一些意想不到的功能。

文章首先回顾了 Python 中 ABC 的基本概念,特别是 __subclasshook__ 的作用:它允许我们自定义一个类是否被认为是某个 ABC 的子类,即使该类本身并没有显式继承该 ABC。作者随后引入了 Python 3.10 新增的模式匹配功能,指出模式匹配在匹配对象类型时会考虑 ABC 的 __subclasshook__

基于此,作者展示了一系列“犯罪式”的用法,例如,创建一个 NotIterable 的 ABC,其 __subclasshook__ 判断一个对象是否具有 __iter__ 方法,从而实现对不可迭代对象的模式匹配。更进一步,作者利用 ABC 实现了对对象属性的模式匹配,甚至可以根据对象是否具有某个属性来进行匹配。

文章还探讨了如何使用动态类型创建组合器,例如 NotAnd 函数,用于动态地创建 ABC,并组合不同的类型判断条件。最后,作者尝试使用带有副作用的 __subclasshook__,例如缓存类型判断结果或与用户交互,但发现 CPython 会缓存 __subclasshook__ 的结果,从而限制了这种用法的可能性。尽管如此,文章仍然展示了使用带有副作用的 ABC 的一些有趣示例,例如 FlipFlop ABC,它可以让每隔一个类型通过匹配。

总而言之,这篇文章揭示了 Python 中 ABC 与模式匹配结合使用时的一些强大而灵活的特性,同时也提醒开发者在使用这些特性时需要谨慎,避免滥用导致代码难以理解和维护。


GPT-5 在医疗语言理解方面的进展:MedHELM 测评

本文介绍了如何将 GPT-5 集成到 Med-HELM 的公开子集中,Med-HELM 是一个专注于医学的基准测试套件,涵盖定量计算、事实问答、证据基础、抗幻觉、公平性探测和文本到 SQL 生成。通过 MedHELM 评估 GPT-5 在医学语言理解方面的进展,并与 GPT-4 时代的基础模型进行比较。

文章重点介绍了 GPT-5 在 MedHELM 的应用,旨在量化最新模型在医学计算、EHR 文本到 SQL、鉴别诊断和抗幻觉等方面的纵向进展,并发现持续存在的高风险失败模式。该研究通过将 GPT-5 添加到现有的 MedHELM 场景中,实现了与 GPT-4 时代基线和其他领先模型的时间比较。研究结果表明,GPT-5 在数值推理和事实召回方面有所提高,但在模式约束生成、公平性推理和完全抑制幻觉方面存在不足。效率方面,一些较长的推理过程运行速度更快,而较短的结构化查询则会产生延迟惩罚,且没有提高准确性。

文章还详细介绍了 MedHELM 的基准测试,包括公共基准、门控基准和私有基准。评估侧重于公共场景,以确保可重复性。选定的场景包括 MedCalc-Bench(定量计算)、Medec(错误检测)、HeadQA(事实推理)、Medbullets(事实召回)、PubMedQA(基于证据的问答)、EHRSQL(文本到 SQL 生成)、RaceBias(公平性评估)和 MedHallu(幻觉检测)。

最后,文章对比了 GPT-5 与 GPT-4o、o3-mini 以及每个场景中的最佳模型的性能。结果表明,GPT-5 在 HeadQA 和 Medbullets 上取得了新的高分,但在 EHRSQL、RaceBias 和 MedHallu 方面表现不佳。效率方面,GPT-5 在某些较长的推理过程中运行速度更快,但在较短的结构化查询中存在延迟惩罚。


1981 Sony Trinitron KV-3000R:奢华电视机的深度评测

这篇YouTube视频深入探讨了1981年索尼Trinitron KV-3000R电视机,这款在当年售价高达1万美元的奢华产品。视频详细介绍了这款电视机的各项功能和设计特点,展现了那个年代高端电视机的制造工艺和技术水平。

视频中,博主详细展示了KV-3000R的外观设计,包括其木质外壳、精致的按钮和接口。同时,还介绍了这款电视机所采用的Trinitron显像管技术,这种技术在当时被认为是画质最好的显像管技术之一。博主还演示了电视机的各种功能,例如频道切换、音量调节等,并展示了其在播放不同类型节目时的画面效果。此外,视频还探讨了这款电视机在当时的市场定位和历史意义,让观众了解了它在电视机发展史上的地位。总的来说,这个视频是对经典电子产品的一次致敬,让人们能够更深入地了解那个时代的科技和设计理念。视频中还展示了与Vintage Video Basement相关的周边产品,包括T恤、帽子和贴纸。

由于没有评论内容,这里就不过多展开讨论了。


美国审查 5500 万签证持有者,严查违规行为

美国正在审查超过 5500 万签证持有者的记录,以评估他们是否违反了入境或居留条件。此次审查范围广泛,包括社交媒体审查,旨在识别对美国公民、文化、政府或原则怀有敌意的人。如果发现签证持有人有逾期居留、犯罪活动、威胁公共安全、参与恐怖活动或支持恐怖组织等行为,其签证将被吊销。

这项政策是特朗普政府反移民策略的一部分,旨在清除“反美主义”,确保美国的利益不被那些鄙视美国和宣扬反美意识形态的人所利用。国务卿 Marco Rubio 还宣布,美国将暂停发放卡车司机的工人签证,理由是外国司机危及美国人的生命和损害美国卡车司机的生计。此前,美国已经采取了一系列限制移民的措施,包括逮捕参与抗议活动的外国学生,以及对部分国家公民收取高额签证押金。

评论区对此政策的反应褒贬不一。

  • 实用性与成本问题: 有评论指出,全面审查签证持有者既不切实际,又耗费巨大,需要大量人力物力。
  • 误伤无辜: 有评论担忧,这种审查可能会出现错误,导致无辜的人受到伤害,甚至认为其目的在于制造残忍。
  • 普遍违规: 还有评论认为,每个人都可能违反过某些规则,因此这种审查带有某种程度的虚伪性,不如直接取消所有签证。
  • 关联讨论: 有评论提供了之前相关讨论的链接,方便读者了解更多背景信息。

AI 产品构建进入概率时代

本文探讨了人工智能(AI)如何从传统的确定性软件开发模式转变为概率性模式,以及这种转变对软件设计、工程和业务增长的影响。文章指出,随着通用人工智能的出现,许多传统的软件开发方法已经过时,我们需要新的框架来理解和构建 AI 产品。

文章首先回顾了经典的软件开发模式,在这种模式下,软件产品将已知的输入映射到预期的结果,具有确定性。例如,在 Instagram 上,用户上传图片、发送消息等操作都会产生预期的结果。这种模式可以用函数 F: X → Y 来表示,其中 x 是用户操作,y 是产品输出。在这种模式下,工程师的目标是确保每次输入 x 都能可靠地产生输出 y,产品经理和设计师的目标是构建一个函数 F,使用户的行为能够转化为业务成果。这种模式依赖于可计数、预定义的输入和输出,因此可以使用漏斗模型和转化率等指标来衡量和优化产品性能。

然而,随着 AI 技术的进步,特别是深度学习模型在泛化能力上的突破,传统的软件开发模式开始面临挑战。AI 模型不再是简单的“狭隘专家”,而是能够学习和理解整个领域的通用结构,从而解锁一系列任务,而无需预先定义这些任务。这意味着 AI 产品的输入和输出不再是有限和预定义的,而是具有概率性的。文章将这种转变比作物理学从牛顿的确定性宇宙到量子力学的转变,软件开发也正在经历一场“量子跃迁”。

构建概率性软件与以往的经验截然不同。传统的软件开发方法强调确定性和可预测性,而 AI 产品则需要处理不确定性和概率性。这意味着我们需要新的工具、框架和思维方式来设计、工程、构建和增长 AI 产品。

由于没有评论内容,这里跳过评论相关的输出。


4chan 拒绝支付英国在线安全罚款:一场跨境监管的冲突

英国媒体监管机构 Ofcom 拟对 4chan 处以罚款,原因是其未能遵守英国《在线安全法》。4chan 的律师表示拒绝支付罚款,认为 Ofcom 的调查是对美国科技公司的“非法骚扰”,并强调 4chan 在美国没有违反任何法律,受美国宪法第一修正案保护。此事引发了关于跨境监管、言论自由以及美国与英国在科技监管方面的冲突的讨论。

文章指出,Ofcom 认为 4chan 有义务保护英国用户免受非法内容侵害,而 4chan 作为匿名论坛,长期以来存在大量极端内容。如果 4chan 在美国法院成功对抗罚款,Ofcom 可能会采取其他手段,例如要求其他服务商屏蔽 4chan 在英国的业务,包括从搜索结果中删除或阻止英国支付,甚至要求 ISP 阻止英国用户访问该网站。美国方面,一些政治家,特别是特朗普政府及其盟友,一直反对英国和欧盟对美国科技公司进行过度监管。美国联邦贸易委员会主席警告大型科技公司,如果它们通过遵守国际法律(如《在线安全法》)来削弱隐私和数据安全要求,可能会违反美国法律。

评论区对这一事件的看法呈现多样化。有人认为,英国政府的最终目标是封锁 4chan 网站,而罚款只是一个借口。也有人指出,4chan 长期未进行软件更新和维护,可能无力实施《在线安全法》要求的聊天控制和年龄验证。还有评论认为,由于 4chan 在英国没有资产,Ofcom 的罚款难以执行。另有评论将此事与维基百科因“Virgin Killer”专辑封面被英国网络观察基金会封锁的事件相提并论,暗示 4chan 可能会直接禁止英国用户访问。还有人认为,如果 4chan 允许英国居民访问其网站,就应该遵守英国法律,否则 Ofcom 应该要求英国 ISP 屏蔽该网站。


AWS CEO 怒斥用 AI 替代初级员工是“最愚蠢的想法”

AWS 的 CEO 认为,用 AI 替代初级员工是极其短视的行为,他强调了初级员工对于企业长期发展的重要性。

AWS CEO 在一次公开讲话中表达了对当前一些企业尝试用 AI 完全替代初级员工的做法的强烈反对,他认为这种做法忽略了初级员工在学习、成长和创新方面所能带来的价值。初级员工不仅能以较低的成本完成某些任务,更重要的是,他们是未来技术人才的储备,能够为企业带来新鲜的视角和创新思维。如果企业完全依赖 AI,可能会陷入技术停滞的困境,失去长期的竞争力。此外,他还提到,初级员工通常对新兴技术更加敏感,更容易接受和适应 AI 工具,他们可以成为企业内部推广和应用 AI 的重要力量,而不是被替代的对象。因此,企业应该更加注重培养和发展初级员工,让他们与 AI 协同工作,共同推动企业的发展。这种观点强调了人才培养的重要性,以及 AI 作为辅助工具而非替代品的角色。


怀旧与技术:在 2025 年拥抱 OS X Mavericks

本文介绍了作者为何以及如何选择在 2025 年继续使用老旧的 OS X Mavericks 系统,并提供了硬件选择、系统获取和初始设置的指南,适合对老旧系统有情怀或有特殊需求的开发者和技术爱好者。

作者分享了自己放弃现代 macOS 的原因,他认为后来的更新逐渐破坏了他对该平台的热爱。在比较了 Windows 和 Linux 之后,他决定回归旧版本的 OS X,最终选择了 Mavericks。文章详细说明了选择 Mavericks 的理由,包括其在速度、美观和应用程序兼容性方面的优势,并解释了为何放弃了 Snow Leopard 和 Mountain Lion。文章还提供了硬件建议,包括推荐的 Mac 型号(如 2013 年的 Mac Pro 和 2014 年的 Macbook Air)以及 Hackintosh 的配置方案,并给出了 CPU、GPU 和存储方面的硬件限制。此外,文章还提供了从 Apple 的 OS Recovery Server 下载 Mavericks 的方法,以及一个用于更新系统和调整默认设置的 post-install 脚本。

由于没有评论内容,这里就Mavericks本身做一些拓展讨论。Mavericks当年引入的一些新特性,比如内存压缩,确实提升了老旧硬件上的性能。而它在界面设计上,也保留了经典 Aqua 风格的精髓,这对于怀旧用户来说非常有吸引力。当然,选择老旧系统也意味着要牺牲一些安全性更新和最新的软件支持,需要在情怀和实用性之间做出权衡。


反洗钱控制系统效果如何?

这篇文章探讨了反洗钱(AML)控制系统的有效性,指出尽管投入巨大,但该系统在阻止严重犯罪收益方面效果有限,并可能产生意想不到的后果。文章深入分析了当前反洗钱体系的运作方式,评估其目标、成效以及存在的不足。

文章首先介绍了反洗钱系统的机构设置和法律义务,这些都是在金融行动特别工作组(FATF)的框架下制定的。随后,文章探讨了反洗钱的目标,揭示了官方宣称的目标与洗钱监管理论中隐含的目标之间的矛盾。文章提出了一种理论,认为监管应侧重于减少犯罪,而非仅仅维护金融系统的完整性。

文章对当前的反洗钱系统进行了评估,分析了FATF主持的相互评估报告,指出这些报告提供了大量信息,但缺乏真正的评估。文章还利用其他数据对系统的有效性进行了评估,并分析了系统性失败的原因。文章认为,反洗钱机制的主要价值在于通过加强调查机构的情报基础,帮助执法机构打击其他犯罪,如毒品贩运和腐败。

文章还深入探讨了反洗钱系统可能存在的风险,包括“去风险化”和金融数据被滥用的可能性。文章强调,政府和其他利益相关者很少提及反洗钱系统的成本,包括银行的直接成本以及可能被剥夺银行服务的客户群体。文章最后总结了七个关键发现,包括银行因违反反洗钱规定而被处以巨额罚款,但银行高管很少面临刑事定罪;洗钱的难度和成本与FATF成立之初相比没有显著变化;大多数洗钱计划本质上非常简单;反洗钱框架不成比例地使富裕国家受益;反洗钱措施为执法调查提供了有价值的情报;以及反洗钱框架的成本很少被提及。

总的来说,这篇文章对反洗钱控制系统提出了深刻的质疑,认为该系统可能并未达到预期效果,并且存在许多需要改进的地方。


将 NetHack 邮件守护进程与 Emacs mu4e 集成

本文介绍了如何将 NetHack 游戏中的邮件守护进程功能与 Emacs 邮件客户端 mu4e 集成,以便在游戏过程中无缝接收和阅读邮件,无需离开 Emacs 环境。作者使用 Lisp 窗口端口玩 NetHack,因此希望在 Emacs 中完成所有操作。

作者首先解释了 NetHack 的邮件功能,该功能允许游戏定期检查指定的 mbox 文件,并在收到邮件时生成一个邮件守护进程,向玩家发送邮件卷轴。阅读卷轴后,将执行邮件程序以供阅读邮件。由于 mu4e 使用 maildir 格式,作者编写了一个 cron 脚本,定期将 maildir 转换为 mbox 格式。脚本的关键在于,NetHack 只检查邮箱文件的修改时间 (mtime),而不是内容。因此,脚本只需检查 maildir 是否包含在过去 n 分钟内收到的任何消息,如果有,则 touch mbox 文件。

接下来,作者提供了一个 bash 脚本,用于打开 mu4e 并搜索未读邮件。作者使用 emacsclient 以避免启动另一个 Emacs 进程,并确保只有一个进程可以锁定 mu 的数据库。作者还提到,他的 emacsclient 经过包装,可以在 Emacs 外部调用时打开新框架,并在 Emacs 内部调用时重用当前框架。最后,作者分享了一段在地下城第一层的游戏视频。

评论区观点:

评论区对这篇文章展现了多种有趣的视角。有人赞赏这种将现实生活融入游戏环境的创意方式,并提到了 Wii U 上的塞尔达传说:风之杖的类似设计。也有人表达了对 Emacs 和类似工具的兴趣,但又觉得难以完全掌握。另一些评论则关注安全问题,例如 NetHack 二进制文件是否在执行邮件命令之前放弃了权限。还有人对文章中提到的游戏元素感到好奇,并表示有兴趣尝试文本游戏。此外,有评论者分享了自己使用其他邮件客户端的经验,并建议使用 Makefile 来简化 touch 脚本。总的来说,评论区既有对文章内容的赞赏和延伸讨论,也有对相关技术和安全问题的关注。


可穿戴设备行为数据的基础模型提升健康预测

这篇论文探讨了如何利用可穿戴设备记录的行为数据,构建基础模型来改善健康预测,重点在于行为数据相较于低级传感器数据,在生理相关的时间尺度和数量级上更具信息量。

文章指出,虽然基础模型在健康预测中应用日益广泛,但主要集中在低级传感器数据上,忽略了行为数据的重要性。研究人员使用来自 16.2 万人的超过 25 亿小时的可穿戴设备数据,系统地优化了架构和分词策略,开发了行为信号的基础模型。该模型在 57 项与健康相关的任务中表现出色,包括个体分类和时变健康状态预测,尤其在睡眠预测等行为驱动的任务中表现突出。结合原始传感器数据的表示后,模型性能进一步提升。这项研究强调了为可穿戴设备定制基础模型设计的重要性,并展示了其在促进新型健康应用方面的潜力。该论文已被 ICML 2025 接收。


Text.ai 招聘创始全栈工程师,打造 AI 原生消费体验

Text.ai 正在招聘一位创始全栈工程师,负责构建下一代 AI 原生消费体验,专注于革新人们在群聊中的沟通方式。这家公司致力于打造 AI 原生通信平台,目标是让每一次对话都变得智能、协作和轻松。

Text.ai 正在构建一个全新的 AI 产品类别,旨在让数百万用户每天使用。与构建独立的 AI 助手不同,他们专注于解决消费级 AI 中最困难的问题:通过真正的群体智能,同时让多个用户满意。他们的 AI 不仅仅是响应提示,而是持续存在、学习、思考和适应,从而改善每一次人际连接,将混乱的群体协调转变为轻松的协作。

作为创始全栈工程师,你将成为 Text.ai 新应用体验的技术负责人和驱动者,主要负责 React Native (iOS 和 Android) 以及后端 (Python) 集成。你需要具备 4 年以上发布 React Native 应用的经验,熟悉后端集成,并对用户体验有深刻理解。你将与设计、产品和工程团队紧密合作,快速构建直观且美观的体验。

这个职位提供了一个独特的机会,可以创造新的产品类别,影响数百万用户的日常对话,并参与前沿的 AI 技术创新,例如群体偏好学习、多参与者协调和社会促进算法。你将直接影响产品方向、技术架构和公司文化。

你将负责移动平台的开发,从零开始构建 React Native 应用,创建其他平台无法实现的无缝群组协作体验,并构建感觉神奇而非机械的 AI 原生界面。同时,你还将参与移动后端 (Python) 集成,实现实时群组 AI 协调,并设计可扩展到数百万并发对话的系统。

Text.ai 拥有强大的后盾,包括 Y Combinator、SV Angel 以及来自 Shopify 和 Tencent 的天使投资人。创始团队来自 Tesla、Eventbrite、Amazon 和 McKinsey。公司提供有竞争力的薪酬、有意义的股权、401k 计划以及健身和健身房报销。

(文章中没有评论内容,因此跳过评论分析。)



评论 0 条

暂无评论,来种下第一颗种子。