OpenAI上线网络爬虫工具GPTBot宣称可在版权的基础上抓取信息
发布时间:2023-08-09 11:00:21 所属栏目:动态 来源:互联网
导读: 昨天,OpenAI 放出了它那名叫GPTBot 的网络抓取器程序。官方宣称,该 GPTBot 工具能够在注重版权的基础上,使用透明的方式收集网页信息,来训练 OpenAI 旗下的各 AI 模型。
昨天,OpenAI 放出了它那名叫GPTBot 的网络抓取器程序。官方宣称,该 GPTBot 工具能够在注重版权的基础上,使用透明的方式收集网页信息,来训练 OpenAI 旗下的各 AI 模型。 OpenAI 表示,GPTBot 使用专有网页 UA 表示其爬虫身份,完整 UA 字符串为(Mozilla / 5.0 AppleWebKit / 537.36 / KHTML, like Gecko; compatible; GPTBot / 1.0; + https://openai.com/ gptbot),任何网站管理者都可以自由允许或阻止该爬虫工具进行数据采集。 OpenAI 声称,若网站管理员不希望被爬虫搜集资料,在网站上使用 robots.txt 文件可以让管理员封锁所有来自GPTBot 的访问,或者允许用户选择特定的某个范围的内容被检索出来。 OpenAI 此前饱受业界对于“侵犯隐私问题”的指责,当下 OpenAI 推出这样一套 GPTBot 爬虫工具,可谓是其对于外界批判作出的相应回应,同时也能够推动行业建立 AI 训练用爬虫工具相关基准。IT之家此前报道,OpenAI 日前宣布注册 GPT-5 商标,该 GPTBot 爬虫工具也有望助力 GPT-5 的相关模型训练。助力gpt-5的相关模型训练。该工具可以用于对各种数据进行分析,包括用户行为、网络流量、广告等。据悉,openai计划在今年晚些时候推出这款工具。 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐