IT之家 12 月 13 日音书,据 TechCrunch 12 日报谈J9九游会体育,哈佛大学与谷歌晓示,融合发布 100 万本群众畛域册本当作 AI 试验数据集。 AI 试验所需的数据本钱广泛,但却更顺应资金充裕的科技公司。因此,哈佛大学预备发布一个包含约 100 万本群众畛域册本的数据集,这些册本散失多种类型、话语和作者,包括已不再受版权保护的经典作者如狄更斯、但丁和莎士比亚等,因这些作品的版权已随本事逾期。 图源 Pexels 固然这个新数据集尚未公开,也不明晰具体的发布款式和本事,但
IT之家 12 月 13 日音书,据 TechCrunch 12 日报谈J9九游会体育,哈佛大学与谷歌晓示,融合发布 100 万本群众畛域册本当作 AI 试验数据集。
AI 试验所需的数据本钱广泛,但却更顺应资金充裕的科技公司。因此,哈佛大学预备发布一个包含约 100 万本群众畛域册本的数据集,这些册本散失多种类型、话语和作者,包括已不再受版权保护的经典作者如狄更斯、但丁和莎士比亚等,因这些作品的版权已随本事逾期。
固然这个新数据集尚未公开,也不明晰具体的发布款式和本事,但它开端于谷歌的永恒神色 —— 谷歌典籍(Google Books)。因此,谷歌将参与此次“隆重钞票”的平凡发布。
据IT之家了解,早在本年 3 月,哈佛大学就曾露馅其“机构数据预备(IDI)”,并示意这一预备旨在为 AI 提供“正当数据的着实通谈”。直到隆重运行后,该预备才证明获取了微软和 OpenAI 的资金营救。
IDI 的执行董事格雷格・莱佩特(Greg Leppert)示意J9九游会体育,该数据集的宗旨是“让竞争环境愈加公谈”,通过向包括照拂机构和 AI 初创公司在内的各种机构洞开这一庞大的数据集,以匡助他们试验大型话语模子。
告白声明:文内含有的对外跳转结合(包括不限于超结合、二维码、口令等姿色),用于传递更多信息,检朴甄选本事,后果仅供参考,IT之家所有这个词著述均包含本声明。]article_adlist--> 声明:新浪网独家稿件,未经授权不容转载。 -->