加入收藏 | 设为首页 | 会员中心 | 我要投稿 晋中站长网 (https://www.0354zz.com/)- 科技、容器安全、数据加密、云日志、云数据迁移!
当前位置: 首页 > 站长资讯 > 动态 > 正文

OpenAI上线网络爬虫工具GPTBot宣称可在版权的基础上抓取信息

发布时间:2023-08-09 11:00:21 所属栏目:动态 来源:互联网
导读:   昨天,OpenAI 放出了它那名叫GPTBot 的网络抓取器程序。官方宣称,该 GPTBot 工具能够在注重版权的基础上,使用透明的方式收集网页信息,来训练 OpenAI 旗下的各 AI 模型。



  
  昨天,OpenAI 放出了它那名叫GPTBot 的网络抓取器程序。官方宣称,该 GPTBot 工具能够在注重版权的基础上,使用透明的方式收集网页信息,来训练 OpenAI 旗下的各 AI 模型。
 
  OpenAI 表示,GPTBot 使用专有网页 UA 表示其爬虫身份,完整 UA 字符串为(Mozilla / 5.0 AppleWebKit / 537.36 / KHTML, like Gecko; compatible; GPTBot / 1.0; + https://openai.com/ gptbot),任何网站管理者都可以自由允许或阻止该爬虫工具进行数据采集。
 
  OpenAI 声称,若网站管理员不希望被爬虫搜集资料,在网站上使用 robots.txt 文件可以让管理员封锁所有来自GPTBot 的访问,或者允许用户选择特定的某个范围的内容被检索出来。
 
  OpenAI 此前饱受业界对于“侵犯隐私问题”的指责,当下 OpenAI 推出这样一套 GPTBot 爬虫工具,可谓是其对于外界批判作出的相应回应,同时也能够推动行业建立 AI 训练用爬虫工具相关基准。IT之家此前报道,OpenAI 日前宣布注册 GPT-5 商标,该 GPTBot 爬虫工具也有望助力 GPT-5 的相关模型训练。助力gpt-5的相关模型训练。该工具可以用于对各种数据进行分析,包括用户行为、网络流量、广告等。据悉,openai计划在今年晚些时候推出这款工具。
 
 

(编辑:晋中站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章