加密新闻

26.06.2026
12:12

网站与人工智能交互的新标准:ForkLog Lab 制定游戏规则

img-3fa652605be23854-412125050377607

世界已经改变:如今阅读互联网的不仅是人类,还有算法。AI模型、爬虫程序和自主代理正在积极索引内容,将其用于训练和摘要生成。然而,此前一直缺乏明确的规范来界定机器如何与公共数据进行交互。ForkLog Lab项目通过引入一项创新标准解决了这一问题——一个为AI系统设定规则的机器可读页面。

这是什么标准?

这指的是一个专门的网页区块,作为自动系统的接入点:从搜索引擎机器人和LLM爬虫,到研究平台。该文档明确划分了允许和禁止的内容使用场景。首次集成已与ForkLog杂志实现,该杂志作为测试新协议的首个试点平台。

该标准(0.1版)规定,公共访问允许根据robots.txt进行页面索引、注明来源的简短引用、指向原文的链接以及带有归属声明的非商业研究摘要。然而,未经单独许可,严格禁止大规模爬取、使用完整档案训练商业模型、分发数据集以及删除归属声明。这是在全自动化时代保护版权和数据完整性的重要一步。

访问架构与生态系统

机器可读页面不仅列出规则,还提供多层次的访问系统。共分为四个层级:发现访问(用于搜索引擎和有限的非商业研究)、研究访问(学术用途)、商业数据集访问(面向创建AI产品的公司)以及战略访问(深度集成和长期合作)。

除核心标准外,生态系统还包含两个配套项目:N0X——一个实验性人机知识系统,旨在综合编辑和研究数据;以及doNONdo——一项挑战持续优化文化的网络表演。这些项目对AI实验室、模型开发者和学术研究人员开放合作。

专家视角

这一标准是对内容提供商与AI系统交互领域混乱局面的及时回应。ForkLog Lab不仅保护自身数据,还为整个行业指明了方向。在大型语言模型未经作者同意就在数百万页面上进行训练的情况下,这样的协议不仅是一种工具,更是构建道德、透明数字未来的必要条件。我预计在未来几个月内,其他希望保持对其内容控制权的媒体和平台也将效仿此类举措。