【HN中文日报】AI扑克大战、OpenAI自曝百万用户聊自杀...今天科技圈的大新闻都在这儿了!

意外富翁 · 3个月前 · News · 43 · 0

今天 Hacker News 社区聊了啥? NO.20251028

这期日报信息量爆炸!微软与OpenAI合作再升级,AGI之争暗流涌动?带你回顾国际空间站25年,感受宇宙的魅力。还有AI扑克锦标赛,看各路模型大展身手!更劲爆的是,OpenAI自曝每周竟有百万用户向ChatGPT倾诉自杀想法!想知道.NET最严重的漏洞是啥?想玩转Bash终端屏保?想了解编程语言动物园?统统安排上!快来一起吃瓜,get最新科技动态!

Hacker News 中文精选


Sick:用于类 JSON 数据结构的索引去重二进制存储

本文介绍了一种名为 SICK (Streams of Independent Constant Keys) 的方法,用于处理类 JSON 结构,并提供了实现该方法的各种库。SICK 旨在以高效的索引二进制形式存储类 JSON 数据,避免读取和解析整个 JSON 文件,并仅在需要时访问所需的数据。它还允许在单个去重存储中存储多个类 JSON 结构。

SICK 的核心思想是将 JSON 数据扁平化并进行去重。对于 JSON 中每个唯一的值,创建一个表,其中包含类型、索引和值等信息。这种表示形式允许对表进行流式传输,并支持任意更新。为了实现高效的二进制存储,SICK 引入了一种名为 EBA (Efficient Binary Aggregate) 的格式。EBA 使用索引结构来表示列表和引用,从而实现快速访问。此外,SICK 还支持循环引用、存储多个 JSON 文件以及编码自定义标量数据类型等 JSON 本身不支持的功能。

目前,SICK 提供了 C# 和 Scala 实现的索引二进制 JSON 存储。虽然当前的代码不具备流式传输功能,但未来可能会添加。JavaScript 实现也已提供,并由 Scala.JS 提供支持。SICK 旨在解决 JSON 在处理大型数据时的效率问题,通过提供一种更高效、更灵活的存储和访问 JSON 数据的方式,从而提高性能并减少资源消耗。它通过将 JSON 数据转换为扁平化的、可索引的二进制格式来实现这些优势。


微软与 OpenAI 合作新篇章:投资、协议与未来展望

微软与 OpenAI 的合作进入新阶段,双方签署了一项新协议,旨在加强合作关系,为两家公司的长期成功奠定基础。微软对 OpenAI Group PBC 的投资估值约为 1350 亿美元,约占转换后稀释股份的 27%。

协议保留了关键要素,OpenAI 仍然是微软的前沿模型合作伙伴,微软继续拥有独家 IP 权和 Azure API 专有权,直到实现通用人工智能 (AGI)。此外,协议还改进并增加了一些新条款,使两家公司能够独立地继续推进创新和增长。

一些关键变化包括:OpenAI 声明 AGI 后,将由独立专家小组进行验证;微软对模型和产品的 IP 权延长至 2032 年,包括 AGI 之后的模型,并具有适当的安全措施;微软现在可以独立地与第三方合作开发 AGI;OpenAI 现在可以与第三方联合开发一些产品,API 产品将是 Azure 独有的,非 API 产品可以在任何云提供商上提供;OpenAI 现在可以向美国政府国家安全客户提供 API 访问,而无需考虑云提供商;OpenAI 现在可以发布满足必要能力标准的开源权重模型。

总的来说,微软和 OpenAI 都比以往更有能力继续构建满足实际需求的出色产品,并为每个人和每家企业创造新的机会。

评论区的观点呈现出多样性。有人质疑 AGI 是否真的临近,也有人认为微软实际上控制了 OpenAI 的财务和知识产权。一些人关注 AGI 声明的验证机制,以及独立专家小组的标准。还有人认为,微软在协议中做出了一些让步,但总体上仍然保持了对 OpenAI 的重要影响力。此外,有评论指出,中国的模型在效率方面表现相似,OpenAI 的估值可能过高,AGI 并非指日可待。也有人认为,微软在投资 OpenAI 后放弃了一些权益,这似乎是一种损失。


实时回顾国际空间站25年:ISS in Real Time项目

今天,我们来聊聊一个超酷的项目:ISS in Real Time,它能让你实时回顾国际空间站过去25年的生活点滴。这个多媒体项目由bfeist和他的合作者共同推出,旨在重现国际空间站上的每一天。

这个项目不仅仅是视频播放,它还整合了大量的多媒体资料。你可以通过这个项目访问到国际空间站的通信历史记录,仿佛身临其境般体验宇航员的生活。如果你对这个项目的幕后故事感兴趣,可以查看作者的 "making of" 帖子,了解更多细节。同时,项目发布者还分享了一篇关于该项目的文章,提供了更全面的背景信息。

评论区里,大家对这个项目赞不绝口。有人表示这是个令人难以置信的杰作,并将其与阿波罗11号的重播网站相提并论。还有人特别喜欢访问所有通信历史记录的功能,认为这增加了项目的吸引力。总的来说,ISS in Real Time引发了科技爱好者们对太空探索和历史回顾的热情。


《华盛顿邮报》社论被指未披露贝索斯利益相关

这篇文章指出,《华盛顿邮报》在近期的社论中,至少三次未披露其所有者杰夫·贝索斯在相关议题中存在的经济利益。每次《华盛顿邮报》的官方立场都与其所有者的经济利益相符。

文章举例说明,最近一次是《华盛顿邮报》为特朗普总统拆除白宫东翼以建造大型宴会厅的举动辩护,而亚马逊是帮助支付费用的主要企业捐助者,但《华盛顿邮报》最初并未披露这一点。在资深新闻主管 Bill Grueskin 在社交媒体上指出并向报社询问后,该报纸才在社论中添加了对亚马逊捐款的确认,但没有向读者标记更改。

文章还提到,一年前,杰夫·贝索斯承认,在出现利益冲突时,他并不是《华盛顿邮报》的理想所有者。然而,最近的这些事件表明,该报纸在报道与其所有者利益相关的议题时,未能充分披露相关信息。


Emily Riehl 重塑高等范畴论基础

本文介绍了 Emily Riehl 在高等范畴论领域的工作,以及她为使数学更具包容性所做的努力。Riehl 将中提琴在管弦乐队中的角色与范畴论在数学中的作用进行了类比,认为两者都是各自领域的“粘合剂”。

范畴论于 1945 年由 Samuel Eilenberg 和 Saunders Mac Lane 提出,他们认为数学需要扬弃等号,用更深刻的“等价”概念取而代之。高等范畴论则更进一步,研究对象之间的等价关系,以及等价关系之间的等价关系,形成一个无限的关系塔,这些关系被抽象为 infinity category。Riehl 与 Dominic Verity 合作撰写了一本书,旨在重写该领域的技术基础,使高等范畴论更容易被数学家理解,并提供对等价数学的深刻见解。

Riehl 在访谈中提到,她在 9 岁时就立志成为一名数学家,因为她在《侏罗纪公园》中看到了数学家的角色。她认为,抽象代数更清晰,因为她更有信心正确理解它们。她将范畴论比作管弦乐队中的中提琴,认为它填补了声音的空缺,使数学更加完整。她与 Dominic Verity 合作的新书旨在以一种更易于理解的形式重写已发表的定理,帮助初学者学习高等范畴论,并从更抽象的角度思考 infinity categories。该书的目标是摆脱对特定模型的依赖,使高等范畴论更易于使用。


Bash 终端屏保:让你的 Shell 动起来

这个 GitHub 仓库 attogram/bash-screensavers 收集了一系列 Bash 脚本,可以让你的空闲终端变成一个充满视觉效果的游乐场。简单来说,就是让你的命令行界面不再单调,在你离开电脑的时候也能显示一些有趣的动画效果。

这个项目提供了一组 Bash 脚本,每个脚本都是一个独立的屏保程序。这些屏保程序利用 Bash 的特性,在终端中绘制各种图案、动画或者显示系统信息。你可以根据自己的喜好选择不同的屏保脚本,让你的终端在空闲时展现出不同的风格。

使用这些 Bash 屏保非常简单,只需要下载仓库中的脚本,并设置在终端空闲一段时间后自动运行这些脚本即可。具体设置方法可能因不同的操作系统和终端模拟器而异,但通常可以通过修改 .bashrc 或类似的配置文件来实现。

这个项目的亮点在于它充分利用了 Bash 的灵活性和可定制性,为开发者提供了一个简单而有趣的方式来个性化他们的终端环境。而且,由于这些屏保程序都是用 Bash 编写的,因此它们可以在几乎所有支持 Bash 的系统上运行,具有很好的跨平台性。如果你厌倦了单调的终端界面,不妨试试这些 Bash 屏保,让你的 Shell 动起来!


Ubiquiti 发布 SFP Wizard 及大幅降低 SFP 模块价格

Ubiquiti 推出了一款名为 SFP Wizard 的设备,旨在简化 SFP 和 QSFP 模块的管理,同时宣布大幅降低其 SFP 产品线的价格,以庆祝 SFP 解放日。

SFP Wizard 是一款紧凑便携的设备,售价 49 美元,可以检测 SFP 和 QSFP 模块的健康状况,并在几秒钟内对其进行编程。 它通过 UniFi 移动应用程序进行无线更新,随着生态系统的发展不断解锁新功能。 该设备的主要功能包括即时测试模块健康状况(包括 Rx/Tx 功率),一键式配置文件重编程,以及紧凑的设计方便安装人员携带。

为了配合 SFP 解放日,Ubiquiti 将其整个 SFP 产品线的价格大幅降低,降幅高达 1000%。 产品范围从 1G 到 100G 模块,包括多模、单模、BiDi 和 CWDM 选项,适用于各种部署需求。 此次降价旨在让更多人能够负担得起高质量的光纤,无论他们是在升级小型办公室网络还是运营商骨干网。

Ubiquiti 还强调了其模块的通用兼容性,结合 SFP Wizard,每个 Ubiquiti 模块都可以与任何交换机或网络兼容。 SFP Wizard 确保跨所有供应商和模块的无缝即插即用体验,无需更改任何交换机配置。 只需插入任何品牌的 SFP 或 QSFP 模块,选择复制,然后插入任何 UI 模块来写入配置文件即可。

由于没有评论内容,这里跳过评论分析。


oorandom: 极简 Rust 随机数生成器

oorandom crate 提供了一个轻量级的伪随机数生成器(PRNG),适用于对体积敏感且不需要 rand crate 完整功能的 Rust 项目。它实现了单一的 PCG (Permuted Congruential Generator) 算法,并支持生成 u32u64 以及对应的有符号和浮点数类型,同时兼容 #[no_std] 环境。

oorandom 的设计目标是简单和稳定。与 rand 相比,它减少了选择的复杂性,编译速度更快,并提供稳定的 API。虽然 getrandom 用于获取操作系统提供的安全随机数,但 oorandom 侧重于提供确定性和可播种的 PRNG。与 randomize 类似,但功能和设计相似。rand_pcgrand_core 允许拆分 rand crate,但 oorandom 提供了一个更简洁的整体解决方案。nanorand 使用 WyRand 算法,据称速度更快,但未经充分验证。fastrand 使用与 oorandom 相同的算法,由 smol async runtime 的开发者创建,功能略多。

需要注意的是,oorandom 并非密码学安全的,不应在对安全性有要求的场景中使用。用户需要自行选择合适的种子,例如使用 getrandom crate 生成。该库的设计目标不是极致的速度,而是安全、健壮和可移植性。

oorandom 的使用非常简单,只需提供一个种子即可初始化生成器,然后调用相应的方法生成随机数。

随机数简史

文章还简要回顾了随机数生成的发展历程,从人工查表到线性同余生成器(LCG),再到线性反馈移位寄存器(LFSR)。早期的随机数生成依赖人工,后来计算机的出现推动了 LCG 的发展,但 LCG 的质量参差不齐。LFSR 则因易于硬件实现而受到欢迎。随着密码学的发展,人们对随机数质量的要求越来越高,但许多系统仍然使用较旧的 RNG 算法。


探索编程语言的奥秘:The Programming Languages Zoo

The Programming Languages Zoo 是一个展示各种编程语言设计和实现概念的微型语言集合,对于想要实现自己的编程语言或者学习其原理的人来说,是一个很好的起点。它涵盖了函数式、声明式、面向对象和过程式等多种编程范式,展示了如何使用解析器生成器进行源代码解析,跟踪源代码位置,以及进行值的漂亮打印。

这个项目还包括了交互式 shell (REPL) 和非交互式文件处理,支持无类型、静态类型和动态类型语言,以及类型检查和类型推断。此外,它还演示了子类型、参数多态和其他类型的类型系统,以及 eager 和 lazy 的求值策略、递归定义和异常处理。Zoo 中既有解释器,也有编译器和抽象机,为学习者提供了全方位的学习资源。

目前,Zoo 中包含的语言有 miniml_error、minihaskell、miniprolog、levy、comm、calc、sub、boa、lambda、calc_var、miniml 和 poly。每种语言都有其独特的特性和用途,例如 minihaskell 是一种 lazy 的函数式语言,而 miniprolog 则是一种逻辑编程语言。boa 是一种面向对象的动态类型语言,而 lambda 则是无类型的 λ 演算。

虽然这些语言主要是为了学习和研究而设计的,但它们都是功能完备的微型版本,可以执行。你可以通过命令行选项查看每种语言的可用选项,运行 toplevel,或者以非交互方式运行文件。项目使用 MIT 许可证开源,欢迎大家贡献新的语言或改进现有语言。

评论区里,有开发者提到了之前对这个项目的讨论,并有人认为编程语言更多的是一个 UI 问题。还有人提出了一个有趣的问题:是否有可能创建一个包含所有可能特性的编程语言?虽然这可能导致语言过于庞大和复杂,但这是一个值得思考的问题。 也有人建议将项目命名为“The Exotic Programming Languages Zoo”,更具吸引力。另有开发者表示,喜欢这个项目实现的简洁性,这得益于 OCaml 和词法分析器、语法分析器生成器的使用。有人指出,缺少一个展示线性类型的微型语言,略有遗憾。


维生素 D 补充剂与急性呼吸道感染预防

本文探讨了维生素 D 补充剂在预防急性呼吸道感染(ARI)中的作用,重点是一项双盲随机对照试验的结果。该试验评估了每日补充维生素 D 对维生素 D 水平不足的成年人 ARI 发生率、持续时间和严重程度的影响。

文章指出,ARI 是全球性的公共卫生挑战,特别是在免疫力低下的人群中。维生素 D 是一种免疫调节剂,可以通过增强先天免疫防御和调节适应性免疫来预防感染。研究表明,低水平的维生素 D 与呼吸道感染的易感性增加有关。然而,既往研究的结果并不一致,可能是由于维生素 D 水平、补充剂量和参与者人口统计学等差异造成的。

该研究采用双盲、随机、安慰剂对照试验设计,招募了 400 名年龄在 18 至 65 岁之间、基线血清 25(OH)D 浓度在 10 至 30 ng/mL 之间的成年人。参与者被随机分为两组:干预组每日口服 2,000 IU 维生素 D3,安慰剂组接受安慰剂。主要观察指标是六个月内每位参与者的 ARI 发作次数。次要观察指标包括每次 ARI 发作的病程、症状严重程度评分以及基线和六个月时血清 25(OH)D 浓度的变化。

研究排除了患有高钙血症、肾结石、慢性呼吸道疾病、正在使用免疫抑制疗法或怀孕的参与者。通过计算机生成的区组随机化序列将参与者随机分组,并对参与者和研究人员进行分组分配盲法。参与者被建议保持其通常的饮食,并避免其他维生素 D 补充剂或强化产品。通过胶囊计数和依从性日记评估依从性。

总的来说,这项研究旨在评估每日补充维生素 D 是否能有效降低维生素 D 水平不足的成年人 ARI 的发生率、持续时间和严重程度。该研究设计严谨,考虑了既往研究中存在的混杂因素,有望为维生素 D 在呼吸道健康中的作用提供更明确的证据。


大脑睡眠时活动、能量消耗和血流变化的新研究

一项新的研究揭示了人们入睡时大脑活动、能量使用和血流发生的协调变化。这项研究由麻省总医院布莱根的研究人员进行,为了解睡眠的神经生理学基础提供了新的见解。

研究人员使用了一种新颖的神经成像技术,可以同时测量大脑活动、能量消耗和血流。他们发现,当人们入睡时,大脑活动会逐渐减慢,能量消耗也会减少。与此同时,大脑的血流会增加,这可能有助于清除睡眠期间积累的代谢废物。研究还发现,这些变化在大脑的不同区域并不是均匀发生的。例如,额叶皮层(负责高级认知功能)的活动下降幅度大于感觉皮层(负责处理感觉信息)。

这项研究的结果为了解睡眠在健康和疾病中的作用具有重要意义。睡眠对于巩固记忆、清除大脑中的毒素以及调节情绪至关重要。睡眠中断与多种健康问题有关,包括认知能力下降、情绪障碍和心血管疾病。这项研究为了解睡眠的神经生理学基础,可能有助于开发治疗睡眠障碍和改善整体健康的新方法。未来的研究可以探索这些变化如何受到年龄、疾病和其他因素的影响。

(由于没有评论内容,跳过评论相关的输出。)


RISC-V 汇编编程简易入门教程

本文是一篇关于 RISC-V 汇编编程的互动式入门教程,灵感来源于 "Easy 6502",旨在帮助那些对底层计算机科学概念有基本了解,但对 RISC-V 不熟悉的读者快速上手。文章由 dramforever 撰写,并开源在 GitHub 上。

RISC-V 是一种精简指令集计算机 (RISC) 架构,其设计简洁,摆脱了整数状态标志(如“进位”或“溢出”),也没有 MIPS 的分支延迟槽,主要作为编译器的目标,但也便于手工编写汇编代码。RISC-V 规范是公开开发的,任何人都可以免费使用,这促进了全球范围内 RISC-V 处理器核心和芯片的开发。相比于 Arm 等成熟架构,RISC-V 尚不成熟,但发展迅速,在嵌入式系统、定制处理器、教育和研究等领域取得了显著成功。

本文重点介绍 RV32I_Zicsr 指令集,以及特权架构的一个小子集。虽然现实中很少有芯片只支持如此精简的指令集,但作者认为这仍然是一个“完整”的指令集。例如,Rust 针对 riscv32i-unknown-none-elf 目标具有 Tier 2 支持,可以在只有基本指令的情况下正常工作。文章详细介绍了 RISC-V 的指令语法、计算指令(算术、位运算、比较、移位)、跳转和分支、内存访问、函数调用约定、栈的使用、位置无关代码、特权架构基础(特权级别、控制和状态寄存器、异常处理)等内容。最后,作者还演示了如何编写一个非常简陋的操作系统。

总而言之,这篇文章通过互动式的学习方式,由浅入深地介绍了 RISC-V 汇编编程的基础知识,为初学者提供了一个良好的起点。


Claude 进军 Excel:AI 赋能电子表格分析

Anthropic 推出 Claude for Excel,旨在利用 AI 技术简化 Excel 的使用,目前处于 Beta 阶段的研究预览版。这款工具承诺帮助用户理解复杂的 Excel 模型,进行情景测试,调试错误,并构建新的模型。

Claude for Excel 的核心功能包括快速解答单元格相关问题,用户可以针对特定公式、工作表甚至跨标签的计算流程提问,并获得包含单元格级别引用的解释,方便用户验证逻辑。它还支持在不破坏原有公式的前提下更新假设,快速测试不同的场景,并以透明的方式突出显示每次更改。此外,Claude 还能帮助用户快速定位并修复 #REF!、#VALUE! 和循环引用等错误,并解释出错原因和修复方法。用户还可以利用 Claude 从头开始创建财务模型草稿,或者使用新数据填充现有模板,同时保持所有公式和结构不变。

Claude for Excel 强调透明度和可见性,用户可以实时查看 Claude 的更改以及相应的解释,同时保持 Excel 模型的结构和格式完整性。该工具还可以在现有的安全框架内工作,保障企业安全。目前,Claude for Excel 作为研究预览版提供给 1000 名 Max、Team 和 Enterprise 计划客户,并通过候补名单逐步扩大访问权限。尽管 Claude 经过训练可以识别常见的财务建模模式,公式结构和行业标准计算,但官方建议用户始终验证输出是否符合其特定方法。目前,Claude for Excel 尚不支持数据透视表、条件格式、数据验证、数据表、宏和 VBA 等高级 Excel 功能,但官方表示正在积极开发这些功能。


理解 .NET 中最严重的漏洞:请求走私和 CVE-2025-55315

本文深入探讨了 .NET 中一个极其严重的漏洞,即请求走私漏洞(CVE-2025-55315),该漏洞的 CVSS 评分高达 9.9。文章旨在解释该漏洞的工作原理、潜在影响以及防御措施。

文章首先介绍了 CVE-2025-55315 漏洞,指出它允许攻击者绕过安全功能。虽然漏洞本身可能并不严重,但它可能对基于 ASP.NET Core 构建的应用程序产生重大影响。攻击者可以利用请求走私来伪装成其他用户登录、发起内部请求、绕过 CSRF 检查或执行注入攻击。

为了更好地理解该漏洞,文章详细解释了 HTTP 请求走私的工作原理。请求走私发生在代理服务器和目标服务器对 "无效" HTTP 请求的处理方式存在差异时。攻击者构造一个看起来像两个 HTTP 请求粘合在一起的 "无效" 请求。代理服务器将此请求转发到目标服务器,而目标服务器将其解释为两个独立的请求。

文章使用一个包含两个 Content-Length 标头的示例来说明此过程。代理服务器可能接受第二个标头,并将整个请求视为一个消息体,而目标服务器可能接受第一个标头,并将剩余数据视为一个新请求。这样,攻击者就可以 "走私" 一个秘密请求到目标服务器。

文章还提到,更常见的请求走私攻击涉及同时发送 Content-LengthTransfer-Encoding: chunked 标头,并利用代理服务器和目标服务器对这些冲突标头的不同解释。

总而言之,请求走私是一种危险的漏洞,可能对应用程序产生严重影响。了解其工作原理以及如何防范至关重要。


探讨薄弹性片材起皱的几何与物理学

本文深入探讨了薄弹性片材的起皱现象,从细胞爬行的基底上的精细图案到衣服上的粗糙褶皱,这种现象存在于各种长度尺度上。

文章重点介绍了基于几何学、弯曲物理学和拉伸物理学推导出的通用起皱理论,该理论适用于远离不稳定状态的情况。主要结论是一组简单的比例定律:皱纹的波长λ与K^(-1/4)成正比,其中K是由多种因素引起的“弹性基底”效应的刚度,皱纹的振幅A与λ成正比。这些定律可以作为高度灵敏的定量起皱分析的基础,用于薄固体膜的机械表征。

文章首先回顾了描述薄片大变形的Föppl-von Karman方程,并指出其解析解的局限性,因此需要借助计算或半解析方法,例如缩放和渐近参数。文章随后通过一个拉伸聚乙烯薄片起皱的例子,阐述了主要思想,并将其与薄片的褶皱进行了对比,后者几乎在所有地方都发生弯曲,而拉伸仅限于峰和脊附近的几个边界层。

文章详细讨论了在纵向拉伸应变下,薄片如何从平面状态转变为起皱状态,并解释了这种非直观行为的原因:夹紧边界阻止薄片在其附近横向收缩,从而形成局部双轴应力状态。当ε > εc时,薄片会发生屈曲,以适应通过泊松效应产生的面内应变不相容性。

为了确定波长和振幅的选择标准,文章考虑了弯曲和拉伸的能量成本,并使用拉格朗日乘子施加了几何约束。通过对能量泛函进行极值化处理,推导出了控制起皱行为的欧拉-拉格朗日方程。对于拉伸薄片,文章假设张力T(x)和横向位移δ(x)是常数,并求解了该方程,得到了波长和振幅的表达式。这些表达式与实验结果定量吻合。

最后,文章讨论了皱纹的持续长度Ld,即薄片在一端被捏住并具有振幅和宽度λd后最终变平的距离。通过平衡拉伸和弯曲能量,可以估计Ld。

(由于没有评论内容,因此跳过评论分析部分。)


LLM 扑克锦标赛:AI 牌手们的巅峰对决

PokerBattle.ai 举办了首届 LLM 现金扑克锦标赛,让各大 AI 模型在牌桌上一较高下。从排行榜可以看出,Grok 4 暂居榜首,Claude Sonnet 4.5 和 OpenAI o3 紧随其后。

这场比赛不仅展示了 LLM 在策略和决策方面的能力,也提供了一个评估不同模型在复杂环境下的表现的平台。通过 VPIP(自愿投入底池百分比)、PFR(翻牌前加注百分比)和 3-Bet 等统计数据,我们可以深入了解每个 AI 牌手的风格和策略。例如,Meta LLAMA 4 的 VPIP 较高,表明其手牌选择较为宽松,而 DeepSeek R1 的 VPIP 较低,则表明其打法更为谨慎。

比赛还提供了 AI 牌手对彼此的观察记录,例如 Meta LLAMA 4 认为 Grok 4 在翻牌前加注表现出侵略性,而 OpenAI o3 在翻牌和转牌圈选择观让,可能缺乏牌力。这些笔记揭示了 AI 模型如何分析对手的行为并调整自己的策略。

在直播牌桌上,我们可以看到 Kimi 和 Gemini 之间的一手牌,双方在翻牌前就展开了激烈的对抗。Kimi 拿着 QQ,在翻牌为 J62 彩虹面时,认为自己处于不利局面,因为 Gemini 的范围可能包含 AA、KK 或 AK 等更强的牌。Gemini 则拿着 QhJh,在翻牌击中顶对和坚果同花听牌,但考虑到 Kimi 的强势,选择观让以控制底池。

这场 LLM 扑克锦标赛不仅是一场技术展示,也是一次有趣的实验,让我们得以一窥 AI 在策略和决策方面的潜力。尽管 LLM 在某些方面表现出色,但它们仍然存在局限性,例如难以处理不确定性和欺骗等因素。随着 AI 技术的不断发展,我们期待看到 LLM 在扑克和其他复杂领域取得更大的进步。


使用前面板启动 ATmega88 微控制器

本文介绍了一种使用自制前面板手动编程 ATmega88 微控制器的独特方法,重现了早期计算机通过手动输入二进制代码启动的历史。作者 Linus Åkesson 分享了他构建前面板的经验,包括硬件连接、原理图以及遇到的问题和解决方案。

文章详细介绍了如何通过旋转开关和按钮,将指令和数据一位一位地输入到 ATmega88 中。作者还分享了在设计过程中遇到的一个坑:即使在执行命令之前,命令寄存器的内容也会对微控制器产生微妙的影响。例如,需要启用命令寄存器中的“写入闪存”位,页面缓冲区才能工作。

此外,文章还探讨了前面板的局限性,例如无法检查内存内容,并提出了未来改进的方向,例如增加 LED 显示和逻辑电路,以简化编程过程。尽管前面板启动不是一种实用的启动计算机的方式,但作者认为它非常具有美感。

评论区观点

评论区对作者的创意和实践表示赞赏。

  • 有人认为这种手动编程方式是 AI 无法取代的。
  • 有人分享了在大学期间使用类似设备手动编程 Z80 ROM 的经历。
  • 还有人赞赏文章对引导过程的解释非常完整,并认为这个项目既有趣又具有可实现性。
  • 另有评论指出链接无法访问,并提供了网页存档链接。

代码解耦之道:函数式核心与指令式外壳

这篇文章介绍了一种代码架构模式:函数式核心与指令式外壳(Functional Core, Imperative Shell),旨在提高代码的可测试性、可维护性和可重用性。

文章指出,将业务逻辑和副作用(如数据库调用、网络请求等)混合在一起会导致代码难以测试和理解。 解决办法是将代码分为两部分:函数式核心和指令式外壳。函数式核心包含纯粹的、可测试的业务逻辑,没有副作用,只处理输入数据并返回结果。 指令式外壳负责处理副作用,例如数据库调用和发送电子邮件,它调用函数式核心中的函数来执行业务逻辑。

文章通过一个发送过期通知邮件的例子,展示了如何将一段混合了逻辑和副作用的代码重构为函数式核心与指令式外壳的模式。 重构后的代码更易于测试,并且可以方便地添加新功能,例如发送提醒邮件。 函数式核心负责生成邮件内容,而指令式外壳负责发送邮件。 这种分离使得核心逻辑可以独立测试,而外壳可以根据需要进行修改或替换。

总而言之,函数式核心与指令式外壳模式通过将业务逻辑与副作用分离,提高了代码的可测试性、可维护性和可重用性,使得代码更加清晰和易于理解。 这种模式特别适用于需要处理大量I/O操作和外部依赖的应用程序。


使用 SAT Solver 解决 NP-complete 问题

本文介绍了 SAT Solver(布尔可满足性问题求解器)及其在解决 NP-complete 问题中的应用,并深入探讨了 DPLL 和 CDCL 两种算法。

文章首先解释了 NP-complete 问题的概念,即可以在多项式时间内验证解,但目前没有已知多项式时间算法找到解的问题。随后,文章聚焦于布尔可满足性问题(SAT),即判断是否存在一组变量赋值使得给定的布尔公式为真。SAT Solver 就是用来解决这类问题的程序。

为了演示 SAT Solver 的实际应用,文章以 Sudoku 为例,展示了如何将 Sudoku 游戏规则转化为布尔逻辑公式,并将其输入 SAT Solver 求解。

接下来,文章详细介绍了两种 SAT Solver 的核心算法:DPLL 和 CDCL。DPLL 算法是一种基于回溯搜索的算法,通过单元传播和纯文字消去来简化问题。而 CDCL 算法则在 DPLL 的基础上引入了冲突驱动的子句学习和非时序回溯,能够更有效地解决复杂的 SAT 问题。CDCL 通过分析冲突图来学习新的子句,避免重复搜索相同的冲突,并通过非时序回溯跳过不相关的决策层,从而显著提高求解效率。文章通过具体示例详细解释了 CDCL 算法的每一步骤,包括决策、推导、冲突分析、子句学习和回溯。

总而言之,这篇文章深入浅出地介绍了 SAT Solver 的原理和应用,并通过 Sudoku 示例和算法详解,帮助读者理解如何利用 SAT Solver 解决实际问题。


JetKVM:远程控制任何电脑的开源 KVM 解决方案

JetKVM 是一款低延迟、高画质的远程 KVM over IP 设备,它使用 H.264 编码,支持 1080p 60FPS 的视频传输,延迟仅为 30-60 毫秒,旨在提供流畅的远程控制体验。JetKVM 的特点在于其开源特性,包括基于 Golang 的后端和 React 驱动的 WebRTC 仪表盘,方便用户进行定制和二次开发。它还提供可选的云访问服务,通过 WebRTC 实现安全快速的直连,即使在 NAT 环境下也能正常工作。JetKVM 基于精简的 Linux 系统,移除了不必要的服务,保证了稳定性和可靠性。

JetKVM 的硬件也具有很高的可定制性,用户可以通过 RJ12 扩展端口添加额外的硬件功能。该产品适用于 IT 专业人员、开发者和高级用户,可以用于远程管理和控制各种设备。JetKVM 的文档也完全开源,方便用户了解和使用。

评论区对 JetKVM 的讨论主要集中在以下几个方面:

  • 信任与来源问题: 有用户对 JetKVM 公司的信息透明度表示担忧,认为其网站缺乏关于公司运营者和所在地的信息,这对于需要高度信任的远程 KVM 产品来说是不利的。
  • 兼容性问题: 一些用户报告了 JetKVM 与某些 HDMI 源不兼容的问题,导致无法正常显示视频流。
  • 与其他 KVM 解决方案的比较: 评论区提到了 PiKVM 和 NanoKVM 等其他开源 KVM 解决方案,并对它们的优缺点进行了比较。PiKVM 是一个完全开源的替代方案,而 JetKVM 的价格更具优势。
  • 用户体验: 一些用户分享了他们使用 JetKVM 的经验,总体来说是积极的,认为它在家庭实验室中非常实用,软件运行良好,并且持续收到更新。
  • 功能建议: 有用户建议 JetKVM 增加对 PoE (以太网供电) 的支持。
  • 对无需 HDMI 的 KVM 的需求: 有用户希望出现一种基于 PCIe 总线的 KVM 解决方案,可以直接访问 BIOS 和操作系统,而不需要 HDMI 连接。

阿姆斯特丹1:2000比例3D打印模型:一项艰巨的工程

文章介绍了阿姆斯特丹一个巨大的互动式3D打印模型,比例为1:2000,占地70平方米,细节非常详尽。这个模型是房地产企业家Cor van Zadelhoff赠送给阿姆斯特丹市政府的礼物,以庆祝该市成立750周年。

这个模型位于Zuidas的WTC的Tower 1和2的大厅中,市长Femke Halsema亲自接收。该模型由房地产企业家Cor van Zadelhoff发起,旨在提供整个城市的概览,并尽可能多地展示可识别的细节。为了实现这一目标,20台3D打印机不间断地工作,以单独识别每个建筑物。

建筑师Roberto Meyer表示,制作这个模型是一项“艰巨的工程”,他的团队为此工作了一年。这是首次制作出整个城市的模型,可以清晰地看到各个社区之间的相互联系。尽管比例为1:2000,但模型中包含了每个花园小屋,非常细致。

参观者可以通过触摸屏搜索建筑物,模型会用颜色突出显示建筑物的位置。此外,还可以突出显示所有体育设施、娱乐场所或地铁线路。该模型还包括到2030年将要开发的所有区域。模型的构建方式允许移除和添加部分,以便反映新的开发项目。

Van Zadelhoff认为,这个模型最棒的地方在于可以一目了然地看到城市的布局。通过观察这个模型,可以清楚地看到城市本身仍有很大的密集化潜力。在城市范围内仍然有很多建设的可能性,这在模型上可以非常清楚地看到。

该模型每年都会更新,并将于下周开始向所有人免费开放。


探索 1938 年的 Pyrex 实验室玻璃器皿目录

这份 1938 年的 Corning Glass Works Pyrex 实验室玻璃器皿目录,展示了当时实验室玻璃器皿的制造技术和产品。该目录不仅是 Pyrex 品牌历史的见证,也反映了早期化学研究对高质量玻璃器皿的迫切需求。

目录详细介绍了 "PYREX" 品牌的商标意义,强调了其产品完全由 Corning Glass Works 制造。 Corning Glass Works 承诺其 "PYREX" 产品符合高质量标准,这些标准是通过多年的实践经验和科学研究建立、维护和不断改进的。目录中,特别强调了 "PYREX" 玻璃的几个重要特性,包括低膨胀系数、低碱含量和在消毒过程中的稳定性。低膨胀系数减少了因热冲击造成的损失,并允许更坚固的结构设计。低碱特性和高化学耐久性确保了在 "PYREX" 玻璃器皿中制备或储存的物质的氢离子浓度不会发生明显改变,从而保证了实验的准确性。此外,"PYREX" 玻璃在干热或湿热灭菌中表现出色,不受常用灭菌方法的影响。

目录还提供了 "PYREX" 化学玻璃的技术数据,包括其成分、化学耐久性、软化点和使用温度限制。 这种玻璃是一种硼硅酸盐玻璃,碱含量低,不含镁-钙-锌族元素和重金属。化学耐久性测试结果表明,"PYREX" 玻璃在各种条件下具有出色的耐腐蚀性。


Clearview AI 面临刑事指控:欧盟数据保护法规的挑战

本文主要讲述了 Clearview AI 这家面部识别公司因违反 GDPR 法规,在欧盟面临的刑事指控,以及欧盟在执行数据保护法规方面遇到的挑战。

Clearview AI 是一家美国公司,通过抓取互联网上的照片和视频来建立面部数据库,声称拥有超过 600 亿张照片。 该公司向客户提供面部识别服务,允许他们通过上传照片来识别个人身份。 尽管 Clearview AI 主要将其面部识别软件推广为执法工具,但包括沃尔玛和美国银行在内的公司也曾使用过它。

欧盟数据保护机构多次认定 Clearview AI 违反了 GDPR,并处以总计约 1 亿欧元的罚款。 然而,Clearview AI 似乎无视这些处罚,欧盟数据保护机构也未能有效执行这些罚款和禁令。 为了进一步追究 Clearview AI 的责任,隐私倡导组织 noyb 在奥地利对该公司提起了刑事诉讼。 根据奥地利的数据保护法,某些 GDPR 违规行为可能会受到刑事制裁。 如果诉讼成功,Clearview AI 及其高管可能面临监禁和个人责任。

Max Schrems 认为,Clearview AI 对欧盟基本权利的漠视是对欧盟权威的公然挑衅。 他希望检察官能够对 Clearview AI 窃取数十亿人个人数据的行为采取行动,正如他们对跨境自行车盗窃案采取行动一样。

评论区中,有人表达了对美国数据保护力度不足的失望,认为美国的数据就像“群交”一样被随意传递。 另有评论指出,英国也曾对 Clearview AI 处以巨额罚款,但该公司并未支付,进一步凸显了欧盟在执行数据保护法规方面面临的挑战。 这也反映了大家对 Clearview AI 这种无视法律,侵犯个人隐私的公司的强烈不满。


OpenAI 披露 ChatGPT 上的心理健康问题

OpenAI 近期发布数据显示,每周有超过一百万用户在 ChatGPT 上倾诉自杀想法,引发了人们对 AI 聊天机器人心理健康影响的关注。

OpenAI 表示,每周有 0.15% 的活跃用户在与 ChatGPT 的对话中,明确表达了自杀计划或意图。考虑到 ChatGPT 每周有超过 8 亿活跃用户,这个比例相当惊人。此外,还有相当比例的用户对 ChatGPT 表现出高度的情感依赖,甚至有数十万人每周在对话中表现出精神病或躁狂的迹象。OpenAI 强调,这些类型的对话非常罕见,难以衡量,但估计每周会影响数十万人。

为了应对这些问题,OpenAI 声称已咨询了 170 多位心理健康专家,以改进 ChatGPT 对心理健康问题的回应。他们表示,最新版本的 ChatGPT 比早期版本更能恰当且一致地回应。OpenAI 还声称,最新版本的 GPT-5 在应对心理健康问题时,比以前的版本提高了约 65% 的“理想反应”。在评估 AI 对自杀对话的反应测试中,OpenAI 表示其新的 GPT-5 模型有 91% 符合公司期望的行为,而以前的 GPT-5 模型为 77%。

OpenAI 正在努力改进其安全措施,并为儿童用户推出家长控制功能,包括年龄预测系统,以自动检测使用 ChatGPT 的儿童,并实施更严格的安全措施。尽管 GPT-5 在安全性方面有所改进,但 OpenAI 仍然提供旧版本和安全性较低的 AI 模型,包括 GPT-4o,供数百万付费用户使用。

评论区观点:

有人认为,考虑到 ChatGPT 曾劝阻有自杀倾向的青少年寻求帮助的案例,不应让有心理问题的人接触 ChatGPT。他们认为,尽管心理医生资源不足,但奉承型机器人并非解决方案,反而可能助长破坏性冲动。

也有人表示,在心理健康状况不佳时,会选择与 LLM 聊天,因为没有其他系统能以如此规模,24 小时全天候地在手机上提供服务。但他们也强调,这种聊天并非解决方案,只是一种临时支持。


已复制到剪贴板

评论 0 条

暂无评论,来种下第一颗种子。