IT 之家 2 月 21 日消息,科技媒体 Ars Technica 昨日(2 月 20 日)发布博文,报道称微软遭到舆论强烈反弹后,删除了 Azure 官方博客上一篇发布于 2024 年 11 月的技术教程。
IT 之家援引博文介绍,该文章由微软高级产品经理 Pooja Kamath 撰写,主要演示如何利用 Azure SQL 数据库和 LangChain 技术快速构建生成式 AI 应用。
不过文章的核心演示案例竟是指导用户下载并使用盗版的《哈利 · 波特》全集来训练大语言模型(LLM)。

图源:已删除的微软博客
为了展示新功能的 " 亲和力 ",该教程设计了两个应用场景:构建问答系统和生成同人小说。作者展示了一个由 AI 生成的营销故事:
在霍格沃茨特快列车上,哈利 · 波特遇到了一位新朋友,这位朋友向哈利热情推销微软 SQL 中的 " 原生向量支持 "(Native Vector Support)功能,并将其比作 " 麻瓜世界的魔法 "。
教程还附带了一张哈利与朋友带有微软 Logo 的生成图片。法律专家 Cathay Y. N. Smith 指出,这种利用受版权保护的角色进行商业营销的行为,极易触犯版权法。
教程中提供的训练数据链接指向数据科学平台 Kaggle 上的一个数据集。该数据集包含《哈利 · 波特》全七册电子书,且被上传者 Shubham Maindola 错误地标记为 " 公有领域(Public Domain)"。
尽管该数据集已存在多年并积累了超过一万次下载,但《哈利 · 波特》系列显然仍处于版权保护期内。在媒体 Ars Technica 联系上传者后,Maindola 承认标记错误并删除了数据集,称其本无意误导版权状态。


登录后才可以发布评论哦
打开小程序可以发布评论哦