進入展臺在線留言

歡迎聯系我

有什么可以幫您？在線咨詢

一張畫兩種評價：AI 藝術偏見的腦科學證據

來源：維拓啟創（北京）信息技術有限公司 2026年04月16日 20:46

一張畫兩種評價：AI 藝術偏見的腦科學證據

引言/背景

引言：什么是技能的天花板效應？

當AI生成的畫作在國際藝術比賽中奪冠、在以高價成交，一個問題浮出水面：面對一幅畫，如果你被告知它出自AI之手，你還會像欣賞人類畫作那樣去感受它嗎？近年來，生成式人工智能在創意領域取得了令人矚目的進展，AI生成的藝術作品在視覺質量上已經可以與人類創作相媲美。然而，公眾對AI創作的接受度和評價卻遠未跟上技術的腳步。已有研究表明，人們在得知作品由AI生成后，往往會給出更低的評價——即便作品本身相同。這種現象被稱為“算法厭惡”（algorithm aversion），但其背后的神經機制一直缺乏深入探究。究竟是什么驅動了這種偏見？它僅僅停留在主觀評價層面，還是已經深入到大腦的認知加工過程中？

論文概要

近日，華東師范大學團隊采用EEG與fNIRS雙模態技術，揭示了AI藝術標簽偏見的神經機制，成果發表于《Social Cognitive and Affective Neuroscience》，題為“Neural correlates of evaluative bias against artificial intelligence-labeled versus human-labeled artworks”。研究針對現有AI偏見研究缺乏神經證據的局限，控制畫作客觀一致，僅操控“人類/AI”標簽，對125名被試開展行為與神經測試。結果表明，被試對AI標注作品評分顯著更低，且人類標注作品可引發更強P300、α波活動及右側角回與額下回功能連接；對AI態度越積極，偏見越弱。

文章信息

研究方法

本研究包含兩項預注冊實驗，均采用被試內設計，核心操作在于：所有畫作實際上相同，但被隨機標注為“人類創作”或“AI生成”。參與者在每次試次中先看到標簽提示，隨后呈現畫作，最后從審美價值、創造性、情感表達和整體喜好四個維度對畫作進行評分（如圖1）。

圖1 (a) 實驗流程示意圖(b) AI條件下畫作呈現示意圖(c) 人類條件下畫作呈現示意圖

實驗一（EEG研究）

實驗一共招募60名大學生參與。在參與者觀看和評價畫作的過程中，同步記錄腦電信號重點分析畫作呈現后的事件相關電位（ERP）成分——特別是P300成分，以及alpha頻段（8-13 Hz）的功率譜變化。此外，構建了基于EEG特征的預測模型，用以區分人類標簽和AI標簽條件下的神經活動模式（如圖2）。

圖2 (a) EEG數據和(b) fNIRS數據的模型構建細節

實驗二（fNIRS研究）

實驗二共招募65名大學生參與，實驗范式與實驗一類似。使用近紅外設備對參與者在評價畫作過程中的腦血氧動力學變化進行實時監測。感興趣腦區包括背外側前額葉皮層（DLPFC）和角回（AG），研究者分析了各腦區的激活水平，并通過功能連接分析考察了額下回（IFG）與角回（AG）之間的協同活動模式。

圖3 探頭放置位置示意圖

研究結果

1.行為學結果

兩項實驗均一致發現：當畫作被標注為“AI生成”時，參與者在多個評價維度上給出了顯著更低的評分（如圖4）。這一結果在控制了畫作本身相同的前提下獲得，直接證實了標簽驅動的評價偏見的存在。此外，參與者對AI的態度（通過問卷測量）能夠預測其偏見程度——對AI持更消極態度的參與者，表現出更強的反AI評價偏見。

圖4 研究1的行為學結果(a) 在四個維度上，人類與人工智能在評分上的差異(b) 人類與人工智能在觀看畫作時所花費時間的差異(c) 對人工智能的態度對參與者對人工智能創作的藝術品產生的偏見的影響

圖5 研究2的行為學結果(a) 在四個維度上，人類與人工智能在評分上的差異情況(b) 對人工智能的態度如何影響人們對人工智能創作的藝術品的評價

2.EEG結果

在畫作呈現后的 P300 時間窗口內，人類標簽條件誘發的 P300 波幅顯著高于 AI 標簽條件（圖 6a、6b）；P300 作為與注意分配、刺激評估相關的經典 ERP 成分，表明當個體認為作品由人類創作時，會自動投入更多注意資源與認知加工。

人類標簽條件下的全腦 α 頻段功率也顯著更高（圖6c、6d）；在神經美學與創造性認知研究中，α 波增強通常反映自上而下的內源性注意、深度審美加工與認知參與，提示人們在面對 “人類創作” 標簽時會進入更深層的審美與情感加工狀態。基于 α 波段活動構建的預測模型顯示，人類標簽條件下的評分預測優于 AI 標簽條件（圖6e），進一步證實兩種標簽條件下的神經加工模式存在穩定、系統性差異。

圖6 不同呈現方式（人類操作與人工智能操作）對腦電圖活動的影響(a) 顯示了與畫作同步的FC2頻段上的平均ERP波形，圖中的曲線反映了P300波形在頭皮上的分布情況(b) 顯示了人類操作和人工智能操作條件下P300波幅的差異(c) 顯示了左右半腦中α波功率的分布情況(d) 顯示了人類操作和人工智能操作條件下α波功率平均值的差異(e) 顯示了人類操作和人工智能操作條件下預測模型的預測性能差異

3.fNIRS結果

fNIRS結果顯示，AG在人類標簽條件下的激活水平顯著高于AI標簽條件（圖7b）。角回是默認模式網絡的關鍵節點，主要參與語義加工、記憶整合與情緒聯結加工，該結果表明，當被試認為畫作由人類創作時，會進行更深入的語義解讀與情感共鳴加工。DLPFC激活呈現條件與試驗序列的交互效應（圖7a），提示審美評價過程中認知控制與決策加工隨任務進程發生動態調整。另外，IFG-AG之間的功能連接在人類標簽條件下顯著增強（圖7c）。

圖7 (a) DLPFC激活的結果，以及順序和條件對Beta值的影響(b) AG激活的結果，以及順序和條件對Beta值的影響(c) 各功能區域在四種評分方式中的作用

注：黃色條形表示那些在人類和人工智能兩種條件下都能有效預測評分的功能連接，這兩種條件之間沒有顯著差異；紅色條形表示那些在人類條件下預測權重明顯高于人工智能條件的功能連接；藍色條形則表示那些在人工智能條件下預測權重明顯高于人類條件的功能連接。顏色的深淺反映了兩種條件下預測權重差異的大小，顏色越深，差異越大。

結論與展望

本研究采用兩項預注冊實驗，結合EEG與fNIRS技術，從行為與神經層面系統揭示了藝術作品來源標簽引發的評價偏見。行為結果顯示，在作品相同的情況下，僅標注“AI生成”就會顯著降低評價得分，且偏見程度受個體態度調節。神經結果表明，人類標簽可引發更強的注意投入與深層認知加工，并增強右側角回激活及額下回—角回功能連接，支持更充分的語義整合與情感加工。

研究存在一定局限：采用標簽操控而非真實創作來源對比，被試主要以大學生為主。未來可拓展真實作品對比、擴大樣本范圍，并開展縱向追蹤，探究偏見隨技術普及的變化趨勢。

原文信息鏈接

Zhang W, Xie C, Jiang L, Yang L, Hu Z, Hao N. Neural correlates of evaluative bias against artificial intelligence-labeled versus human-labeled artworks. Social Cognitive and Affective Neuroscience, 2025, 20(1): nsaf071.

作者及團隊介紹

該研究由華東師范大學心理與認知科學學院完成；論文作者為Wenyu Zhang，其他作者包括Cong Xie、Liuqing Jiang、Li Yang、Zhe Hu。通訊作者為郝寧教授，郝寧教授課題組長期聚焦創造性認知的神經機制、人類與人工智能協同創新、群體創造的腦間互動等前沿方向，綜合運用 EEG、fNIRS 等技術開展創造性認知與審美評價的神經基礎研究。

關于維拓啟創

維拓啟創（北京）信息技術有限公司成立于2006年，是一家專注于腦科學、康復工程、人因工程、心理學、體育科學等領域的科研解決方案供應商。公司與國內外多所大學、研究機構、企業長期保持合作關系，致力于將優質的產品、技術和服務帶給各個領域的科研工作者，為用戶提供有競爭力的方案和服務，協助用戶的科研工作，持續提升使用體驗。

相關產品

Advictor

了解更多產品詳情，投稿發布

與合作，歡迎掃碼咨詢。

復制搜一搜

暫無評論

相關產品

免責聲明

凡本網注明“來源：儀表網”的所有作品，均為浙江興旺寶明通網絡有限公司-儀表網合法擁有版權或有權使用的作品，未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明“來源：儀表網”。違反上述聲明者，本網將追究其相關法律責任。
本網轉載并注明自其它來源（非儀表網）的作品，目的在于傳遞更多信息，并不代表本網贊同其觀點或和對其真實性負責，不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時，必須保留本網注明的作品第一來源，并自負版權等法律責任。
如涉及作品內容、版權等問題，請在作品發表之日起一周內與本網聯系，否則視為放棄相關權利。