100 萬本公共領域書籍,為 AI 訓練提供合法數據

      2024-12-17

      來源:IT之家

      據 TechCrunch 12 日報道,哈佛大學與谷歌宣布,聯合發布 100 萬本公共領域書籍作為 AI 訓練數據集。

      AI 訓練所需的數據成本高昂,但卻更適合資金充裕的科技公司。因此,哈佛大學計劃發布一個包含約 100 萬本公共領域書籍的數據集,這些書籍覆蓋多種類型、語言和作者,包括已不再受版權保護的經典作家如狄更斯、但丁和莎士比亞等,因這些作品的版權已隨時間過期。

      雖然這個新數據集尚未公開,也不清楚具體的發布方式和時間,但它來源于谷歌的長期項目 —— 谷歌圖書(Google Books)。因此,谷歌將參與這次“寶貴財富”的廣泛發布。

      據IT之家了解,早在今年 3 月,哈佛大學就曾透露其“機構數據計劃(IDI)”,并表示這一計劃旨在為 AI 提供“合法數據的可信通道”。直到正式啟動后,該計劃才確認得到了微軟和 OpenAI 的資金支持。

      IDI 的執行董事格雷格?萊佩特(Greg Leppert)表示,該數據集的目標是“讓競爭環境更加公平”,通過向包括研究機構和 AI 初創公司在內的各類機構開放這一龐大的數據集,以幫助他們訓練大型語言模型。



      更多新聞
      火山引擎×上汽集團:共建汽車全場景AI新體驗

      火山引擎×上汽集團:共建汽車全場景AI新體驗

      Moka AI 探索實踐:七年技術深耕,從單點突破到招聘全流程閉環

      Moka AI 探索實踐:七年技術深耕,從單點突破到招聘全流程閉環

      2025快手磁力大會:加速“生成新商業”,AI全面重塑商業經營

      2025快手磁力大會:加速“生成新商業”,AI全面重塑商業經營

      精品无码无人网站免费视频 | 中文字幕精品亚洲无线码一区应用| 国产精品视频一区二区三区无码| 亚洲一区二区三区AV无码| 无码夫の前で人妻を侵犯| 无码av中文一二三区| 亚洲韩国—中文字幕| 精品久久久久久无码中文字幕一区| 中文在线最新版天堂bt| 伊人久久无码精品中文字幕| 中文字幕7777| 亚洲av永久无码精品秋霞电影影院| 亚洲精品无码不卡在线播放HE| 国产精品热久久无码av| 亚洲免费无码在线| 国产色爽免费无码视频| 无码人妻熟妇AV又粗又大 | 亚洲中文字幕丝袜制服一区| 国产成人午夜无码电影在线观看| 欧美中文在线视频| 精品久久久久久无码专区不卡 | 久久久久亚洲av成人无码电影| 无码人妻少妇伦在线电影| 亚洲av中文无码乱人伦在线播放| 无码中文字幕日韩专区视频| 无码人妻AV一二区二区三区| 岛国av无码免费无禁网| 最好看的最新高清中文视频| 中文字幕人妻色偷偷久久| 久久久久亚洲AV无码麻豆| 中文无码vs无码人妻| 中文字幕无码无码专区| 国模吧无码一区二区三区| 亚洲AV中文无码乱人伦下载| 国产精品亚洲w码日韩中文| 亚洲日韩国产二区无码| 久久久久久综合一区中文字幕 | 狠狠躁狠狠躁东京热无码专区| 国精品无码一区二区三区在线蜜臀| 91中文字幕在线观看| 午夜无码视频一区二区三区|