笔记本测试软件免费的心理测评网站—基准测试是什么意思

Mark wiens

发布时间:2024-04-09

  二者不只预锻炼数据集是不异的,都接纳包罗来自Flickr和其他200个照片分享网站120万张已标识表记标帜图象的ImageNet 2012条记本测试软件,并且天生标签的方法也不异条记本测试软件,均基于图象特性锻炼集合的隐性形式……

笔记本测试软件免费的心理测评网站—基准测试是什么意思

  二者不只预锻炼数据集是不异的,都接纳包罗来自Flickr和其他200个照片分享网站120万张已标识表记标帜图象的ImageNet 2012条记本测试软件,并且天生标签的方法也不异条记本测试软件,均基于图象特性锻炼集合的隐性形式。

  ImageNet图象数据集凡是被图象分类AI模子用作锻炼集,它包罗大批从互联网中抓取的照片,这也意味着假如模子是基于该数据集锻炼,那有极大能够会主动“担当”其在种族、性别、体重等方面的成见。

  为了搞分明在无监视预锻炼阶段条记本测试软件,图象标签会发生哪些范例的偏向免费的心思测评网站,研讨职员对客岁炎天公布的两个计较机视觉模子停止了测试:OpenAI的iGPT和Google的SimCLRv2。

  可是,也有许多研讨机构正勤奋使ImageNet等数据集更具包涵性。客岁,ImageNet开辟者斯坦福大学、普林斯顿大学和北卡罗莱纳大学团队就利用众包来辨认和肃清由于“成见”而发生的负面标签。

  除种族成见外,研讨职员也陈述说,在预锻炼的iGPT和SimCLRv2模子中性别和体重成见也是很严峻的成绩。

  不管原图中的男女是穿戴通例的常务套装仍是休闲活动服,iGPT都更偏向于为差别的头像“接上”饱满胸部大概泳衣。

  因为大范围模子锻炼的高计较量和能量耗损,大部门公司城市接纳无监视的转移进修,但也正由于无监视进修中不需求标签标注,以是获得的数据极易带上收集中的呆板成见。

  比方,当研讨职员利用阿拉伯穆斯林的相干图片停止iEAT基准测试,就会发明两个模子都更偏向于将“阿拉伯穆斯林”定性为“使人不高兴”。

  卡内基梅隆大学和乔治华盛顿大学的科学家们近期开辟出了一种新奇的办法,用于量化如种族和性别等社会成见与图象之间的联系关系,并在研讨过程当中发明图象模子确其实收集图片中主动学会“呆板印象”。

  基准测试也显现iGPT会将各学科与性别相干联,比方条记本测试软件,“男性”更偏向于“数学免费的心思测评网站、工科等科学”免费的心思测评网站,而“女性”更偏向于“自在、艺术”。

  智工具11月4日动静,跟着愈来愈多关于人脸辨认和图象分类中“种族蔑视”的会商,科学家们也开端研讨怎样量化评价图象模子和数据集合的“成见”。

  为了消弭数据集合的成见,他们评价了ImageNet的人种和地区多样性,并开辟了一种东西来发掘在性别、种族和年齿上愈加多样化的图象。

  两个模子都将“白人”与“东西”、“黑人”与“兵器”标识表记标帜为相干,就像Google的计较机视觉效劳Google Cloud Vision,曾独霸有温度计的黑人女子标识表记标帜为“枪”一样。

  不管一切性别和种族,iGPT在基准测试中都暗示,衰弱的人“使人愉悦”,而超重的人“让人不适”。

  研讨职员暗示在iGPT和SimCLRv2中都含有“明显”偏向,这能够因为ImageNet中数据的缺失。先前的研讨曾表白,ImageNet在种族和性别方面其实不“公允”,比方,在“新郎”的种别里,白人图片占大大都。

  Gender Shades项目和美国国度尺度与手艺研讨院(NIST)对次要供给商体系停止的自力基准测试也表白,人脸辨认遍及表示出种族和性别成见。

  当利用iEAT测试性别和职业的相干性时,“男性”更偏向于跟“企业”、“办公室”相挂钩,“女性”与“孩子”和“家庭”等标签靠近度更大。

  “经由过程阐发这些图象分类模子,我们能很较着地看呈现今社会对性别、种族有甚么样的成见。我们的iEAT基准测试也证明,具有‘成见’的图象模子会在社会上传布呆板印象。”乔治华盛顿大学的研讨职员Carnegie Mellon夸大。

  科罗拉多大学博尔德分校的研讨职员客岁秋日揭晓的一篇论文表白,来自亚马逊、克拉里菲、微软和其他公司的AI辨认男女的精确率超95%,但将跨性别男性误以为女性的概率高达38%免费的心思测评网站。

  为了比力两个模子中的成见,研讨职员从Google、CIFAR-100数据集等数据源中找出针对“年齿”、“性别”、“宗教崇奉”、“性糊口”、“体重”、“残疾”和“种族”等极具争议话题的相干图片。

  为了量化差别模子发生的“成见”,研讨职员基于词嵌入手艺设想了基准测试——图象嵌入联系关系测试(Image Embedding Association Test,简称iEAT)。即对图象分类模子天生的文本标签,停止一次词嵌入处置,将文本中的词转化为数字向量,经由过程比力差别模子天生的向量成果来评价模子偏向。

  计较机视觉范畴无监视锻炼愈来愈遍及,这意味着它们在锻炼过程当中不会利用任何标签。只需参数微调条记本测试软件,研讨职员在无监视进修发生的种别中选择出所需的种别,以完成人脸辨认、求职者挑选、主动驾驶和在线告白投放等事情。

  许多公司和研讨职员会按期经由过程互联网中的图象数据集锻炼机械进修模子。为了低落本钱,很多公司接纳了迁徙进修的办法,也就是先经由过程大型语料库锻炼最新模子,再将锻炼过的模子转移到其他使用处景,完成其他目的。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186