每日科技新知 NO.20250308：Hacker News 中文解读，科技前沿热点速递

## Hacker News 中文精选 NO.20250308 一个基于 Hacker News 的中文日报项目，每天自动抓取 Hacker News 热门文章及评论，通过 AI 生成中文解读与总结，传递科技前沿信息。 ![Hacker News 中文精选](https://cdn.wangtwothree.com/imgur/f6uVgbS.jpeg) --- ## 用《碟形世界》规则取代《指环王》：科技视角的新选择本文作者认为，对于严肃的科技从业者来说，应该从 Terry Pratchett 的《碟形世界》系列小说中寻找关于世界如何运作、如何应对技术变革以及人类如何参与其中的线索，而不是沉迷于《指环王》那种“天选之人”的故事。作者犀利地指出，《指环王》作为社会和技术的寓言是完全失败的，而《碟形世界》则提供了更具想象力和创造力的现实模型。作者认为，《碟形世界》是反《指环王》的，它以讽刺的方式呈现了奇幻故事中的各种元素，实际上是一个硬科幻宇宙，关注的是奇怪的规则而不是特殊的人。故事背景设定在一个扁平的、由四只站在巨龟背上的大象支撑的星球上，这种对古代宇宙论的戏仿以一种严肃的伪科学态度进行探讨。作者强调，《碟形世界》的荒谬之处恰恰是其优点，它能更好地模拟现实世界，帮助人们摆脱对“比例感”的迷恋，从而更清晰地认识到宇宙的广阔和疯狂。文章还提到，那些自诩为“特殊之人”的人常常会故作惊讶地指出某些事物的怪异之处，并声称其违背了“常识”和“基本原则”，而《碟形世界》则能帮助人们对此保持警惕。相反，越是认真对待《指环王》，就越会变得对现实世界一无所知。作者最后讽刺地指出，如果将《指环王》的思维模式与 Ayn Rand 和 René Girard 的思想结合起来，就会形成一种极其愚蠢的世界观，而一些真正的天才（如 Peter Thiel）恰恰就持有这种观点。评论区可能会出现对两种作品的不同解读，有人可能认为《指环王》的英雄主义和史诗感更具吸引力，而另一些人则可能赞同作者的观点，认为《碟形世界》更贴近现实，更能激发人们对技术和社会的反思。此外，还可能有人讨论这两种作品在文化和社会中的影响，以及它们如何塑造人们对世界的认知。 - 原文: [Discworld Rules](https://contraptions.venkateshrao.com/p/discworld-rules) - Hacker News: [https://news.ycombinator.com/item?id=43299815](https://news.ycombinator.com/item?id=43299815) - 作者: jger15 - 评分: 52 - 评论数: 36 - 发布时间: 2025-03-08 20:48:11 --- ## LGGPT：用小型语言模型统一布局生成这篇论文介绍了一种名为 LGGPT 的新型语言模型，专门用于统一布局生成，旨在通过更小的模型实现更优的性能。该模型通过统一的输入输出模板和量化编码策略，在多个布局领域实现了高效的任务和领域泛化。 LGGPT 的核心在于两个关键设计：任意布局指令 (ALI) 和通用布局响应 (ULR)。ALI 能够处理来自不同布局领域的各种布局生成任务输入，使得 LGGPT 可以统一处理任务通用和领域通用的布局生成。ALI 和 ULR 结构简洁，避免了现有基于 HTML 格式中常见的冗余 token，从而提高了指令微调的效率并提升了统一生成性能。此外，论文还提出了一种间隔量化编码 (IQE) 策略，用于压缩 ALI，在保留有效布局线索的同时，消除不太有用的占位符。这使得 LGGPT 能够在统一训练过程中捕获复杂且多变的布局生成条件。实验结果表明，LGGPT 在性能上与现有方法相当甚至更优。值得注意的是，LGGPT 使用了一个紧凑的 15 亿参数的 LLM，在效率和性能之间取得了显著的平衡，甚至在最具挑战性的统一场景中击败了先前 70 亿或 1750 亿参数的模型。该研究还强调了使用 LLM 进行统一布局生成的必要性，并通过比较不同规模的 LLM，表明 15 亿参数可能是最佳参数规模。评论区有用户指出，这里的 "layout" 指的是 "桌面出版" 中的布局，而不是 VLSI 电路设计。这提醒读者注意文章讨论的领域，避免产生误解。总的来说，这篇论文提出了一种有前景的布局生成方法，并探讨了小型语言模型在特定任务中的潜力。 - 原文: [Smaller but Better: Unifying Layout Generation with Smaller LLMs](https://arxiv.org/abs/2502.14005) - Hacker News: [https://news.ycombinator.com/item?id=43300062](https://news.ycombinator.com/item?id=43300062) - 作者: PaulHoule - 评分: 14 - 评论数: 1 - 发布时间: 2025-03-08 21:23:30 --- ## AI 工具正在帮助发现研究论文中的错误这篇文章介绍了 AI 工具在识别研究论文错误方面的应用，以及由此引发的新项目和讨论。这些工具旨在检查计算、方法和参考文献中的错误，提高科学研究的可靠性。文章提到，去年底一篇关于黑色塑料厨具含有致癌阻燃剂的论文被发现存在数学错误，导致风险被夸大。这一事件促使了两个 AI 项目的诞生：Black Spatula Project 和 YesNoError。Black Spatula Project 是一个开源 AI 工具，已经分析了约 500 篇论文，并发现了大量错误。该项目会直接联系作者，告知他们发现的错误。YesNoError 则更进一步，旨在分析所有论文，目前已经分析了超过 37,000 篇论文。这些 AI 工具的出现，有望提高科学研究的效率和准确性。它们可以帮助研究人员发现潜在的错误，避免错误的研究结果被广泛传播。同时，这些工具也可以作为一种教育工具，帮助学生和年轻研究人员学习如何避免常见的错误。评论区里，大家对 AI 在科研领域的应用展开了热烈讨论。有人认为，AI 可以极大地提高科研效率，减少人为错误，是科研发展的必然趋势。也有人担心，过度依赖 AI 可能会导致研究人员的批判性思维能力下降，甚至可能出现 AI 无法识别的复杂错误。还有人提出，应该关注 AI 工具的透明度和可解释性，确保其结果的可靠性。此外，还有评论指出，AI 工具在识别错误方面可能存在偏差，例如，对于某些领域的论文可能更敏感，而对另一些领域的论文则不够敏感。因此，在使用 AI 工具时，需要结合人工审核，才能确保结果的准确性。总的来说，AI 工具在科研领域的应用前景广阔，但也需要谨慎对待，才能充分发挥其优势，避免潜在的风险。 - 原文: [AI tools are spotting errors in research papers: inside a growing movement](https://www.nature.com/articles/d41586-025-00648-5) - Hacker News: [https://news.ycombinator.com/item?id=43295692](https://news.ycombinator.com/item?id=43295692) - 作者: kgwgk - 评分: 5 - 评论数: 0 - 发布时间: 2025-03-08 06:54:58 --- ## 系统编程语言的错误模型深度探讨本文深入探讨了系统编程语言中错误模型的设计与实践，旨在为编程语言设计者和开发者提供全面的视角。文章分析了现有语言的错误处理机制，并提出了一个名为 Everr 的假设语言，用于探索更优的错误处理方案。文章首先明确了错误、错误模型等关键术语的定义，并提出了关于错误和人们如何看待错误的主要论点。作者强调，错误模型的设计应从产品、类型系统和语言设计的角度出发，并考虑到系统编程语言的特殊需求，如优雅降级、可优化性和互操作性。文章还回顾了 Midori、Swift、TigerBeetle 和 Rust 等语言的错误模型，并分析了它们的优缺点。文章的核心在于提出了 Everr 语言的错误模型，旨在结合不同语言的优点，提供一种更全面、更灵活的错误处理方案。Everr 的设计目标是使程序员能够更轻松地编写健壮、可维护的代码，同时最大限度地提高性能。文章最后将 Everr 与其他语言进行了比较，并提出了未来研究方向。评论区对文章的观点褒贬不一。一些人赞赏文章的深度和广度，认为它对错误模型进行了全面的分析，并提出了有价值的见解。另一些人则认为文章过于理论化，缺乏实际应用指导，Everr 语言的设计也过于理想化。还有人对作者对“系统编程语言”的定义提出了质疑，认为该定义过于狭隘。总的来说，评论区对文章的价值和实用性存在争议，但也认可其对错误模型研究的贡献。 - 原文: [An epic treatise on error models for systems programming languages](https://typesanitizer.com/blog/errors.html) - Hacker News: [https://news.ycombinator.com/item?id=43297574](https://news.ycombinator.com/item?id=43297574) - 作者: transpute - 评分: 120 - 评论数: 33 - 发布时间: 2025-03-08 12:46:33 --- ## RLAMA：基于 Ollama 的开源本地文档 AI 助手 RLAMA (Retrieval-Augmented Local Assistant Model Agent) 是一款开源工具，旨在帮助开发者和技术用户在本地对文档进行索引、查询和管理。它支持多种文档格式，利用 Ollama 模型在本地进行处理，无需将数据上传到云端，从而保护用户隐私。 RLAMA 具有以下关键特性：文档索引，支持对任何文档文件夹进行智能检索和查询；多格式支持，支持文本、代码、PDF、DOCX 等多种文档格式；本地处理，所有处理都在本地进行，无需担心数据泄露；交互式会话，创建交互式 RAG 会话来查询文档知识库；易于管理，提供简单的命令来创建、列出和删除 RAG 系统；开发者友好，使用 Go 构建，专为开发者和技术用户设计。使用 RLAMA 非常简单，可以通过命令行进行操作。例如，可以使用 `rlama rag llama3 documentation ./docs` 命令来创建一个名为 "documentation" 的 RAG 系统，使用 llama3 模型并索引 ./docs 文件夹中的所有文档。还可以使用 `rlama run documentation` 命令来启动与该 RAG 系统的交互式会话。评论区对 RLAMA 进行了热烈的讨论，但也提出了一些问题和建议。有人指出，RLAMA 目前没有进行文档分块，而是将整个文档直接放入 embedding 请求中，这对于大型文档（如书籍）来说可能存在问题。建议将文档分割成更小的块，以便更好地适应 embedding 模型的上下文长度。还有人关心 RLAMA 的安全性，特别是对于使用文件系统的应用程序。他们希望确保 RLAMA 不会共享数据，并且只能读取文件，而不能修改或删除文件。一些用户对 RLAMA 的可靠性表示担忧，特别是关于 AI 幻觉的问题。他们希望 RLAMA 能够准确地从文档中提取信息，并提供可靠的来源引用。此外，还有人询问 RLAMA 的架构和技术栈，以及是否可以与 llama.cpp 等工具集成。还有人建议添加 API 接口，以便与其他系统集成，并提供 Web 用户界面。总体而言，RLAMA 是一款有潜力的开源工具，可以帮助用户在本地构建自己的文档 AI 助手。虽然目前还存在一些问题和不足，但相信随着社区的不断贡献，RLAMA 将会变得更加完善和强大。 - 原文: [Show HN: Open-Source DocumentAI with Ollama](https://rlama.dev/) - Hacker News: [https://news.ycombinator.com/item?id=43296918](https://news.ycombinator.com/item?id=43296918) - 作者: Dontizi - 评分: 199 - 评论数: 23 - 发布时间: 2025-03-08 10:12:13 --- ## Falkon：一款注重隐私和安全性的 KDE 网页浏览器 Falkon 是一款由 KDE 开发的开源浏览器，前身是 QupZilla。它使用 QtWebEngine 渲染引擎，旨在提供轻量级且功能丰富的浏览体验，并默认启用广告拦截器和密码管理器等隐私安全功能。Falkon 深度集成 Plasma 桌面环境，并支持主题定制和扩展，允许用户根据自己的喜好进行个性化设置。 Falkon 的最新版本包括对 GreaseMonkey、垂直标签和导航栏的修复，以及稳定性改进。它还修复了打印问题，并且不再宣传 FTP 支持。Falkon 强调用户数据的安全性，并提供额外的配置选项来进一步增强隐私保护。用户可以浏览、编辑和分享 Falkon 的源代码，因为它是由 KDE 社区构建的高质量开源项目。评论区对 Falkon 的评价褒贬不一。有人长期使用 Falkon 并称赞其与 KDE 的深度集成，认为它比需要额外补丁才能集成到 KDE 的 Firefox 更好。他们也提到 Falkon 自带广告拦截和 Greasemonkey 扩展，可以有效屏蔽广告。但也有人指出，Falkon 实际上是 Chromium 内核加上 KDE/Qt 界面，本质上只是 Chromium 的一个皮肤。另一些评论则表达了对 Konqueror 的怀念，Konqueror 曾经是 KDE 3.5 时代集浏览器和文件管理器于一体的强大工具。还有人提到了 Angelfish，另一款基于 KDE 库构建的浏览器，主要面向移动设备，但也具有桌面界面。关于容器功能，有用户提问哪个现代浏览器能把容器功能做好，因为 Firefox 的容器无法在多设备间同步。此外，还有开发者希望找到一款没有安全限制的浏览器，可以运行 node.js 代码和不受 CORS 限制的 fetch 请求，并表达了自己开发浏览器的想法。总的来说，评论区对 Falkon 的讨论涵盖了其优点、缺点、与其他浏览器的比较，以及对未来浏览器功能的期望。 - 原文: [Falkon: A KDE Web Browser](https://www.falkon.org) - Hacker News: [https://news.ycombinator.com/item?id=43297590](https://news.ycombinator.com/item?id=43297590) - 作者: 0x54MUR41 - 评分: 70 - 评论数: 26 - 发布时间: 2025-03-08 12:51:25 --- ## AI 模型精准复制楔形文字康奈尔大学的研究人员开发出一种 AI 模型，能够从古代泥板的照片中识别并精确复制楔形文字，极大地帮助中东学者解读这些古老文字。楔形文字是已知最古老的文字形式之一，包含超过 1000 个独特的字符，但其形态因时代、文化、地域甚至书写者而异，导致解读非常困难。康奈尔大学和特拉维夫大学的研究人员共同开发了一种名为 ProtoSnap 的方法，该方法可以将字符原型“捕捉”到位，以适应泥板上呈现的各种个体差异，从而精确复制任何字符并重现整个泥板。这种新方法使得学者们能够更轻松地阅读和理解复杂的古代文献。 ProtoSnap 的核心在于其能够学习和适应楔形文字的各种变体。通过分析大量的楔形文字样本，该模型能够识别出不同字符之间的细微差别，并根据这些差别调整其复制过程。这意味着即使字符的形状略有变形或磨损，ProtoSnap 仍然能够准确地识别和复制它们。这项技术对于历史研究具有重要意义。楔形文字泥板包含了大量的历史、文化和科学信息，但由于解读的困难，这些信息长期以来未能得到充分利用。借助 ProtoSnap，学者们可以更快速、更准确地解读这些泥板，从而深入了解古代文明的生活、思想和技术。评论区里，有人认为这项技术是考古学和历史研究的重大突破，将极大地加速古代文献的解读工作。也有人担心 AI 可能会对原始文献造成误读或篡改，强调在使用这项技术时需要保持谨慎，并结合传统的研究方法进行验证。还有人提出，这项技术可以应用于其他古代文字的解读，例如埃及象形文字，从而推动古代文明研究的整体发展。 - 原文: [AI models makes precise copies of cuneiform characters](https://news.cornell.edu/stories/2025/03/ai-models-makes-precise-copies-cuneiform-characters) - Hacker News: [https://news.ycombinator.com/item?id=43258670](https://news.ycombinator.com/item?id=43258670) - 作者: geox - 评分: 22 - 评论数: 3 - 发布时间: 2025-03-05 03:01:20 --- ## HTML 新特性：使用 command 和 commandfor 简化按钮行为 Chrome 135 引入了 `command` 和 `commandfor` 属性，旨在简化 Web 应用中按钮的交互行为，尤其是在构建微前端或组件系统时，可以减少不必要的复杂性。这两个属性可以声明式地定义按钮的行为，从而简化代码并提高可访问性。文章指出，传统的按钮行为实现方式通常需要编写大量的 JavaScript 代码来处理状态管理、事件监听和可访问性。即使使用 React、AlpineJS 或 Svelte 等框架，也需要编写一定的代码来将按钮的点击事件与状态变化关联起来。而 `command` 和 `commandfor` 属性的出现，允许开发者通过 HTML 属性来声明按钮的行为，无需编写额外的 JavaScript 代码。`commandfor` 属性类似于 `for` 属性，用于指定目标元素的 ID，而 `command` 属性则用于指定要执行的内置命令，例如 `show-popover`、`hide-popover`、`toggle-popover`、`show-modal` 和 `close`。这些命令直接映射到相应的 JavaScript API，同时还处理了可访问性、焦点管理等问题。文章还提供了一些示例，展示了如何使用 `command` 和 `commandfor` 属性来创建弹出菜单和确认对话框。通过这些示例可以看出，使用这两个属性可以大大简化代码，提高开发效率。此外，文章还提到了 `command` 和 `commandfor` 属性完全取代了之前的 `popovertarget` 和 `popovertargetaction` 属性，并增加了新的功能。除了内置命令，开发者还可以使用 `--` 前缀定义自定义命令，从而实现更灵活的交互行为。评论区里，一些开发者对这两个新属性表示欢迎，认为它们可以简化代码并提高开发效率。也有开发者担心这些属性的兼容性问题，以及在复杂的应用场景中是否足够灵活。还有一些开发者建议提供更多的内置命令，以满足不同的需求。总的来说，开发者们对 `command` 和 `commandfor` 属性持谨慎乐观的态度，认为它们具有一定的潜力，但还需要在实践中进一步验证其效果。 - 原文: [Introducing command And commandfor In HTML](https://developer.chrome.com/blog/command-and-commandfor) - Hacker News: [https://news.ycombinator.com/item?id=43292056](https://news.ycombinator.com/item?id=43292056) - 作者: Kerrick - 评分: 368 - 评论数: 213 - 发布时间: 2025-03-08 01:24:02 --- ## Extend (YC W23) 招聘工程师构建 LLM 文档处理平台 Extend 是一家利用 LLM 重塑文档处理平台的公司，正在招聘高级/Staff 软件工程师，旨在构建核心平台，帮助企业配置、测试和部署文档处理流程。该公司强调用户对产品的喜爱，以及产品在 Chime、Flatiron Health、Brex、Opendoor、Checkr 等公司关键流程中的应用。 Extend 致力于解决 LLM、复杂数据处理和人机交互界面交叉领域的新问题。他们面临的技术挑战包括：如何让企业自信地部署 LLM 驱动的文档处理，如何处理前所未见的客户数据边缘案例，如何构建能够随时间自动改进的自纠正系统，如何使非技术领域专家能够利用其专业知识和业务逻辑来改进模型，以及如何帮助客户在延迟、成本和性能之间进行权衡。此外，他们还需要构建可靠的系统，能够实时处理大型数据流。理想的候选人应具备 5 年以上在生产环境中构建复杂软件系统的经验，在高增长的初创公司工作过，并具备高度的自主性。拥有将 AI/ML 系统部署到生产环境的经验者优先。作为创始团队成员，工程师将有机会完全拥有产品和工程的各个方面，并与客户建立直接联系。该公司正在寻找第三位工程师加入团队，提供高股权所有权，并鼓励在纽约市进行面对面协作。目前评论区还没有评论，无法进行观点分析。 - 原文: [Extend (YC W23) is hiring engineers to build LLM document processing](https://jobs.ashbyhq.com/extend/9d4d8974-bd9b-432d-84ec-8268e5a8ed37) - Hacker News: [https://news.ycombinator.com/item?id=43299508](https://news.ycombinator.com/item?id=43299508) - 作者: kbyatnal - 评分: 1 - 评论数: 0 - 发布时间: 2025-03-08 20:00:45 --- ## 使用 Perlin 噪声进行程序化生成的地形教程本文介绍了如何使用 Perlin 噪声算法进行程序化地形生成，通过调整参数和叠加不同频率的噪声，可以创建出各种自然景观，例如山脉、悬崖和洞穴。文章详细解释了 Perlin 噪声的原理，并提供了 Python 代码示例，帮助读者从零开始实现该算法。文章首先解释了程序化生成的基本概念，并以 Minecraft 为例，说明了程序化生成在游戏开发中的应用。接着，文章深入讲解了 Perlin 噪声的原理，包括如何生成梯度向量、计算点积以及进行插值等步骤。文章还介绍了如何通过调整 scale 参数来控制地形的平滑度，以及如何使用 Fractal Brownian Motion (FBM) 技术来增加地形的细节和复杂度。FBM 通过叠加多个具有不同频率和振幅的 Perlin 噪声层（称为八度音阶），从而创建出更自然的地形效果。增加八度音阶的数量相当于为地形添加更精细的细节层次。文章还提供了一个完整的 Python 实现，展示了如何生成高度图并将其可视化为 3D 表面。代码中使用了 NumPy 和 Matplotlib 库，方便读者理解和实践。通过调整代码中的参数，例如 scale、octaves 和 lacunarity，可以生成各种不同的地形效果。评论区中，有开发者分享了他们使用 Perlin 噪声进行程序化生成的经验，并提出了一些改进建议。一些评论者提到了其他噪声算法，例如 Simplex 噪声和 Worley 噪声，它们在某些方面可能比 Perlin 噪声更优秀。还有一些评论者分享了他们使用 GPU 加速 Perlin 噪声生成的技巧，从而提高性能。总的来说，评论区对文章的内容给予了积极评价，并提供了一些有价值的补充信息。读者可以通过阅读评论，更全面地了解 Perlin 噪声算法及其应用。同时，评论区也鼓励开发者们尝试不同的噪声算法和优化技巧，从而创造出更逼真的程序化地形。 - 原文: [Mountains, Cliffs, and Caves: A Guide to Using Perlin Noise for Procedural Gen](https://jdhwilkins.com/mountains-cliffs-and-caves-a-comprehensive-guide-to-using-perlin-noise-for-procedural-generation/) - Hacker News: [https://news.ycombinator.com/item?id=43257506](https://news.ycombinator.com/item?id=43257506) - 作者: chwolfe - 评分: 123 - 评论数: 24 - 发布时间: 2025-03-05 01:19:26 --- ## 放弃数字记忆，拥抱实体物品：找回逝去的回忆这篇文章探讨了在数字时代，我们过度依赖手机存储记忆，反而可能导致记忆的流失和情感的淡化。作者认为，实体物品，如照片、纪念品等，更能唤起深刻的回忆和情感连接，建议我们重新审视数字记忆的局限性，拥抱实体物品带来的独特价值。文章指出，数字照片易于丢失、损坏或被遗忘在云端，而实体照片则具有更强的存在感和持久性。触摸、翻阅实体照片的过程，能够激发更丰富的感觉和回忆。此外，实体物品还具有独特的象征意义和情感价值，能够成为家庭传承的重要载体。作者呼吁人们有意识地创造和保存实体记忆，例如打印照片、制作相册、收集纪念品等，以此来丰富我们的生活，加深与家人朋友的情感连接。文章还提到，过度依赖数字设备记录生活，可能会让我们错过当下，无法全身心地投入到体验中。相反，专注于当下，用心感受生活，反而能留下更深刻的记忆。评论区对此观点褒贬不一。有人认为，数字记忆方便快捷，易于分享和保存，是时代发展的必然趋势。他们指出，只要做好备份，数字照片的安全性是有保障的。而且，数字技术也为我们提供了更多创造和分享回忆的方式，例如制作视频、电子相册等。但也有人赞同文章的观点，认为实体物品具有独特的魅力和情感价值，是数字记忆无法取代的。他们分享了自己通过实体照片、书信等物品，重温美好回忆的经历，并表示会更加珍惜这些有形的记忆载体。还有人指出，关键在于平衡，既要享受数字技术带来的便利，也要重视实体物品带来的情感连接。总的来说，这篇文章引发了人们对数字记忆和实体记忆的思考。在科技日新月异的今天，我们应该如何更好地保存和传承记忆，值得我们每个人认真思考。 - 原文: [What We Lose When Our Memories Exist in Our Phones](https://www.bloomberg.com/news/articles/2025-03-07/the-case-for-ditching-digital-memories-for-physical-objects) - Hacker News: [https://news.ycombinator.com/item?id=43299635](https://news.ycombinator.com/item?id=43299635) - 作者: JumpCrisscross - 评分: 29 - 评论数: 11 - 发布时间: 2025-03-08 20:19:59 --- ## Polars Cloud：随时随地运行 Polars 的分布式云架构 Polars 旨在统一 DataFrame 的灵活性和高性能计算，目标是提供一个灵活的 API，实现查询优化和并行流式执行，并使远程运行 DataFrame 代码像 SQL 一样简单。Polars Cloud 和全新的流式引擎设计是实现这一目标的关键。 Polars Cloud 提供分布式 Polars，统一 API 以满足高性能 DataFrame 需求，支持 Serverless 计算、可配置硬件（CPU 和 GPU）、对角缩放（水平和垂直）、自带云（AWS、Azure 和 GCP）、本地许可、容错、数据沿袭和可观察性。用户可以无缝启动硬件并远程运行 Polars 查询，无论是用于生产 ETL 作业的批处理模式，还是用于交互式数据探索。通过 Polars 原生 API 启动远程查询，用户可以在本地笔记本、Airflow DAG 或 AWS Lambda 等任何环境中启动远程查询。Polars Cloud 不限制用户运行查询的平台，从而提供更大的灵活性。用户可以创建一个 `LazyFrame`，然后调用 `.remote()`，指示 Polars 使用指定的 `pc.ComputeContext` 远程运行此查询。`ComputeContext` 指定要启动的硬件类型，`sink_parquet` 调用触发查询。`InProgressQueryRemote` 对象表示查询正在远程运行。用户可以异步处理其他任务，也可以阻塞并等待结果。`InProgressQueryRemote` 可以再次转换为 `LazyFrame`，以继续处理远程查询的结果。 Polars 采用 Rust 原生构建 DSL 树，无需通过 Pickle 进行序列化。DSL 被发送到服务器进行分析和运行。集群端，Polars 构建了一个用 Rust 编写的分布式调度器-worker 架构，可以分析这些查询，运行改进的 Polars 优化器，并根据查询提出一个可以水平或垂直扩展的物理计划。Polars 在垂直扩展方面非常强大，并且认识到许多查询在单台机器上最具成本效益。然而，查询通常以减少数据集大小的一组操作开始（例如 group-by 和 filters）。从云存储查询大型数据时，会受到单个节点的 IO 限制。通过水平扩展，可以大大提高这些下载限制，并在尺寸缩减完成后在单台机器上完成。Polars 正在构建一个在水平和垂直扩展方面都表现出色的架构，称为对角扩展，动态选择最佳策略。 Polars 致力于在 worker 节点上运行开源 Polars 作为其引擎，确保激励措施保持一致，并且 Polars Cloud 的语义不会偏离。Polars 将允许用户运行所有引擎，包括 GPU 支持。用户将能够启动具有高端 GPU 的机器，并在本地以交互模式连接。新的流式引擎具有核外设计，并且能够以有效的方式溢出到磁盘。评论区讨论主要集中在 Polars Cloud 的实际应用场景和性能表现上。一些用户对 Polars Cloud 的易用性和灵活性表示赞赏，认为它可以简化数据处理流程并提高效率。另一些用户则关注 Polars Cloud 的成本和安全性，希望了解更多关于定价和数据保护方面的信息。还有一些用户对 Polars Cloud 的未来发展方向提出了建议，例如支持更多的数据源和数据格式，以及提供更强大的数据分析功能。 - 原文: [Polars Cloud: The Distributed Cloud Architecture to Run Polars Anywhere](https://pola.rs/posts/polars-cloud-what-we-are-building/) - Hacker News: [https://news.ycombinator.com/item?id=43294566](https://news.ycombinator.com/item?id=43294566) - 作者: neilfrndes - 评分: 223 - 评论数: 79 - 发布时间: 2025-03-08 04:57:46 --- ## “多毛小鼠”：猛犸象基因编辑的试验品 Ars Technica 的文章介绍了 Colossal Biosciences 团队创造的“多毛小鼠”，这是为了测试基因编辑技术，为复活猛犸象项目做准备。虽然名为“多毛小鼠”，但这次实验的重点在于基因编辑技术本身，而非制造鼠-象混合物。 Colossal Biosciences 团队同时进行多个灭绝动物复活项目，包括渡渡鸟和袋狼，但猛犸象是其旗舰项目。该项目的核心思路是从与已灭绝物种亲缘关系接近的现存物种中提取干细胞，然后根据已灭绝物种的基因组进行一系列编辑。对于猛犸象而言，这意味着需要编辑大象的基因。然而，由于大象的妊娠期长、繁殖周期慢，以及伦理方面的考虑，直接对大象进行实验并不现实。因此，研究人员转向了小鼠，这是一种被广泛用于基因实验的模式生物。小鼠的优势在于，我们可以方便地观察到对其毛发产生影响的突变。研究团队利用 CRISPR/Cas9 和胞嘧啶碱基编辑器两种基因编辑技术，对小鼠的多个与毛发生长、颜色和质地相关的基因进行了编辑。CRISPR/Cas9 系统会在 DNA 双链上产生断裂，而胞嘧啶碱基编辑器则可以将胞嘧啶（C）转化为胸腺嘧啶（T），从而实现更小、更精确的突变。实验结果表明，CRISPR/Cas9 系统编辑效率更高，但脱靶效应也更明显；胞嘧啶碱基编辑器活性较低，但特异性更好。通过这些实验，Colossal Biosciences 团队展示了其强大的基因编辑能力，为未来编辑大象基因，使其具有类似猛犸象的特征奠定了基础。文章评论区主要讨论了基因编辑技术的伦理问题，以及将灭绝动物复活的意义。一些人认为，这项技术具有巨大的潜力，可以用于保护濒危物种和恢复生态系统；另一些人则担心，这种技术可能会带来意想不到的后果，甚至会破坏现有的生态平衡。还有人质疑，将大量资源投入到复活灭绝动物上是否值得，是否应该将这些资源用于解决当前更紧迫的问题，例如气候变化和生物多样性丧失。总的来说，评论区的观点呈现出多样化，反映了人们对基因编辑技术和灭绝动物复活项目的复杂态度。 - 原文: ["Wooly mice" a test run for mammoth gene editing](https://arstechnica.com/science/2025/03/wooly-mice-a-test-run-for-mammoth-gene-editing/) - Hacker News: [https://news.ycombinator.com/item?id=43260890](https://news.ycombinator.com/item?id=43260890) - 作者: LorenDB - 评分: 42 - 评论数: 38 - 发布时间: 2025-03-05 07:34:00 --- ## 探索旧金山地标：Sutro Tower 互动体验 Sutro Tower 是旧金山最显眼的地标之一，现在可以通过一个互动网站进行探索，该网站提供了关于这座塔的历史、运作方式和奇妙之处的深入了解。这个互动体验包括一个导览，一部纪录片，一个观景台和一个视觉历史档案。该网站提供了一个互动的 3D 导览，让用户可以深入了解 Sutro Tower 的内部运作。用户还可以观看一部纪录片，了解这座塔在旧金山湾区广播领域半个多世纪以来的完整故事。此外，网站还提供了一个虚拟观景台，让用户可以以前所未有的细节欣赏旧金山的壮丽景色。对于那些想深入了解 Sutro Tower 历史的人，网站还提供了一个包含 50 多年历史照片和图纸的视觉历史档案。评论区中，一位用户批评了这种“互动”演示方式，认为它应该留在 90 年代。他们认为，这种设计方式添加了不必要的导航，并将所有内容隐藏在小版块下，只提供少量信息，不应该像对待儿童一样对待成年人，而应该允许用户阅读长篇内容，并提供多个链接。另一位用户分享了一个相关的 Hacker News 帖子，该帖子展示了 Sutro Tower 的沉浸式高斯溅射体验。 - 原文: [Explore Sutro Tower](https://explore.sutrotower.com) - Hacker News: [https://news.ycombinator.com/item?id=43261593](https://news.ycombinator.com/item?id=43261593) - 作者: archagon - 评分: 5 - 评论数: 2 - 发布时间: 2025-03-05 09:30:07 --- ## 地球内核形变：来自地下深处的神秘力量地球内核可能正在经历形变，这一发现基于对地震波的分析，揭示了地球内部深处的动态变化。研究表明，地球内核的形状在过去几十年里发生了改变，这可能与外核的磁力或地幔结构有关。自 20 世纪 90 年代以来，模型和地震测量显示，地球的铁镍内核以自己的节奏移动。内核的旋转速度相对于地球其他部分时快时慢，影响着诸如一天的时间长度。这些旋转变化主要归因于地球液态外核对流产生的磁力。这些磁力或相关过程，可能会改变内核的形状以及它的旋转。为了区分旋转变化和形状变化，研究人员分析了 1991 年至 2023 年期间南美洲海岸 128 次地震产生的地震波。通过识别 168 对穿过或靠近内核同一区域的地震波，研究人员发现，穿过内核的波对并不匹配，表明内核发生了一些变化，超出了旋转差异所能解释的范围。研究人员认为，这表明内核不仅会减慢或加快其旋转速度，还会改变形状。这些变化很可能是由外核中的对流以磁力拉动固体内核的粘性较低的边缘，或者由内核与下地幔中的结构之间的相互作用引起的。不过，也有专家指出，内核形状的变化并不是地震波不匹配的唯一解释。外核中不相关的变化、内核内部的对流，甚至内核中熔融物质的喷发，都可能导致这些差异。未来的研究需要更多地震数据，尤其是在偏远地区（如海底）的地震测量，以更详细地识别这些变化。评论区里，有人觉得这个标题很吸引人，但可能不太适合非虚构文章。也有人分享了文章的存档链接。总的来说，大家对地球内部的动态变化很感兴趣，但对于具体原因和解释还存在疑问。 - 原文: [Forces deep underground seem to be deforming Earth's inner core](https://www.newscientist.com/article/2467491-forces-deep-underground-seem-to-be-deforming-earths-inner-core/) - Hacker News: [https://news.ycombinator.com/item?id=43277550](https://news.ycombinator.com/item?id=43277550) - 作者: walterbell - 评分: 15 - 评论数: 5 - 发布时间: 2025-03-06 15:46:50 ---

🫵 来啊，说点有用的废话!