當(dāng)前位置:主頁 > 聚焦 > 正文
    OpenAI阻止網(wǎng)絡(luò)爬蟲抓取數(shù)據(jù),避免數(shù)據(jù)被用于訓(xùn)練AI模型
    來源:驅(qū)動中國作者:洞察網(wǎng)2023-08-08 18:09:28


    【資料圖】

    驅(qū)動中國2023年8月8日消息,據(jù)悉,OpenAI 旗下 GPT 模型的訓(xùn)練需要大量的網(wǎng)絡(luò)數(shù)據(jù),這可能涉及到數(shù)據(jù)隱私和版權(quán)等問題。為了解決這些問題,OpenAI 最近推出了一個新功能,讓網(wǎng)站可以阻止其網(wǎng)絡(luò)爬蟲(web crawler)從其網(wǎng)站上抓取數(shù)據(jù)訓(xùn)練 GPT 模型。

    網(wǎng)絡(luò)爬蟲是一種自動化的程序,可以在互聯(lián)網(wǎng)上搜索和獲取信息。OpenAI 的網(wǎng)絡(luò)爬蟲名為 GPTBot,其會以一定的頻率訪問各種網(wǎng)站,并將網(wǎng)頁內(nèi)容保存下來,用于訓(xùn)練 GPT 模型。

    OpenAI 在其博客文章中表示,網(wǎng)站運(yùn)營者可以通過在其網(wǎng)站的 Robots.txt 文件中禁止 GPTBot 的訪問,或者通過屏蔽其 IP 地址,來阻止 GPTBot 從其網(wǎng)站上抓取數(shù)據(jù)。OpenAI 還表示,“使用 GPTBot 用戶代理(user agent)抓取的網(wǎng)頁可能會被用于改進(jìn)未來的模型,并且會過濾掉那些需要付費(fèi)訪問、已知收集個人身份信息(PII)、或者有違反我們政策的文本的來源。”對于不符合排除標(biāo)準(zhǔn)的來源,“允許 GPTBot 訪問您的網(wǎng)站可以幫助 AI 模型變得更加準(zhǔn)確,并提高它們的通用能力和安全性。”

    [責(zé)任編輯:linlin]

    標(biāo)簽:

    相關(guān)文章

    評論排行
    熱門話題
    最近更新
    亚洲综合无码一区二区| 亚洲成a人片在线不卡一二三区| 亚洲精品无AMM毛片| 亚洲一级黄色大片| 18亚洲男同志videos网站| 精品国产_亚洲人成在线高清| 国产AV无码专区亚洲AV漫画| 亚洲精品tv久久久久| 亚洲爽爽一区二区三区| 国产亚洲精aa成人网站| 伊人久久亚洲综合| 亚洲狠狠婷婷综合久久久久| 亚洲国产AV无码专区亚洲AV| 亚洲国产精品无码久久一区二区 | 国产av无码专区亚洲国产精品| 国产精品日本亚洲777| 国产精品亚洲精品久久精品| 在线观看亚洲精品专区| 亚洲精品99久久久久中文字幕| 精品国产人成亚洲区| 亚洲欧洲日产国码无码网站| 亚洲精品国产精品乱码视色| 久久亚洲成a人片| 亚洲精品亚洲人成在线观看麻豆| 亚洲国产一区在线观看| 久久久久久亚洲精品影院| 亚洲精品国产摄像头| 国产亚洲漂亮白嫩美女在线| jlzzjlzz亚洲乱熟在线播放| 亚洲乱码一区二区三区在线观看| 亚洲AV无码成人专区片在线观看 | 亚洲精品天堂成人片AV在线播放 | 国产亚洲老熟女视频| 亚洲国产另类久久久精品| 在线观看亚洲一区二区| 亚洲校园春色另类激情| 亚洲AV无码片一区二区三区| 亚洲第一福利网站在线观看| 亚洲无人区午夜福利码高清完整版| 久久亚洲国产精品| 亚洲一区电影在线观看|