當前位置:主頁 > 聚焦 > 正文
    OpenAI阻止網絡爬蟲抓取數據,避免數據被用于訓練AI模型
    來源:驅動中國作者:洞察網2023-08-08 18:09:28


    【資料圖】

    驅動中國2023年8月8日消息,據悉,OpenAI 旗下 GPT 模型的訓練需要大量的網絡數據,這可能涉及到數據隱私和版權等問題。為了解決這些問題,OpenAI 最近推出了一個新功能,讓網站可以阻止其網絡爬蟲(web crawler)從其網站上抓取數據訓練 GPT 模型。

    網絡爬蟲是一種自動化的程序,可以在互聯(lián)網上搜索和獲取信息。OpenAI 的網絡爬蟲名為 GPTBot,其會以一定的頻率訪問各種網站,并將網頁內容保存下來,用于訓練 GPT 模型。

    OpenAI 在其博客文章中表示,網站運營者可以通過在其網站的 Robots.txt 文件中禁止 GPTBot 的訪問,或者通過屏蔽其 IP 地址,來阻止 GPTBot 從其網站上抓取數據。OpenAI 還表示,“使用 GPTBot 用戶代理(user agent)抓取的網頁可能會被用于改進未來的模型,并且會過濾掉那些需要付費訪問、已知收集個人身份信息(PII)、或者有違反我們政策的文本的來源。”對于不符合排除標準的來源,“允許 GPTBot 訪問您的網站可以幫助 AI 模型變得更加準確,并提高它們的通用能力和安全性。”

    [責任編輯:linlin]

    標簽:

    相關文章

    評論排行
    熱門話題
    最近更新
    国产 亚洲 中文在线 字幕| 亚洲人成依人成综合网| 夜夜亚洲天天久久| 亚洲国产精品乱码一区二区| 亚洲婷婷五月综合狠狠爱| 国产a v无码专区亚洲av| 亚洲国产精品综合久久网络| 亚洲第一永久AV网站久久精品男人的天堂AV| 亚洲熟妇久久精品| 亚洲黄页网在线观看| 亚洲视频无码高清在线| 亚洲AV无码乱码麻豆精品国产| 亚洲av永久无码嘿嘿嘿| 亚洲视频在线观看2018| 亚洲欧美自偷自拍另类视| 亚洲高清乱码午夜电影网| 亚洲AV无码AV日韩AV网站| 亚洲AV综合色区无码一二三区| 亚洲AV无码AV日韩AV网站| 国产精品亚洲五月天高清| 亚洲国产成人乱码精品女人久久久不卡 | 亚洲人成无码网站| 亚洲精品无码永久在线观看你懂的 | 亚洲乱码一区二区三区在线观看 | 亚洲一区二区三区偷拍女厕 | 一本天堂ⅴ无码亚洲道久久| 亚洲精华国产精华精华液| 国产精品无码亚洲精品2021| 免费在线观看亚洲| 亚洲一级片免费看| 国产亚洲精AA在线观看SEE| 亚洲国产成人久久精品影视| 久久亚洲国产精品成人AV秋霞| 亚洲国产高清视频在线观看| 国产成人亚洲精品| 久久久久久亚洲精品无码| 亚洲精品国产高清嫩草影院| 亚洲精品国产精品乱码在线观看| 亚洲AV永久精品爱情岛论坛| 亚洲自偷自拍另类图片二区| 99热亚洲色精品国产88|