你被 AI fine-tuning 了嗎?—從 AI 信任研究與質化分析現場,談合理依賴與過度信任

你被 AI fine-tuning 了嗎? — 從 AI 信任研究與質化分析現場,談合理依賴與過度信任

先說清楚,這不是一篇反 AI 文章。

如果今天還在討論「研究生到底該不該用 AI」,真的是為時已晚。現實是大家都在用,而且只會越用越多。問題早就不是要不要用,而是——你跟 AI 之間,現在到底是什麼關係?一開始通常都很單純。請它幫忙摘要文獻、整理逐字稿、列出可能的研究問題,省一點時間,也少一點手忙腳亂,這些都很合理。真正麻煩的是,它的影響往往不是立刻爆發,而是循序漸進、暗度陳倉。

你不會在第一天就突然把研究判斷全交出去,但你跟AI合作了幾次,覺得它抓重點抓得不錯、整理得也順,慢慢地,就開始覺得:AI 好像真的蠻懂我現在在做的研究。但當你開始覺得它「好像真的很懂我」時,反而該停下來想一下:這是可信賴的協助,還是你已經開始對它暈船了?

很多人以為自己一開始會對 AI 保持警戒,但研究指出,人面對科技時其實常常帶有某種正向偏見,容易先預設它是有效、可靠、值得一試的,一次摘要得不錯、一次分類看起來很合理、一次改寫甚至比自己原稿還順。

久了之後,你不一定會承認「我完全相信它」,但你的行為會先透露出來:你開始比較少回頭查原文,也比較快接受它整理過後的版本。換句話說,你不是一開始就相信 AI,而是被一次次「看起來沒問題」的互動,慢慢 fine-tune 成開始相信它。說得直接一點,你可能已經開始變成一個數位暈船仔。

問題不是 AI 有沒有幫助,它當然有,真正的問題是:這種信任,什麼時候是合理依賴,什麼時候開始變成過度信任?

為什麼人會開始相信 AI?

Glikson 與 Woolley 在回顧人類信任 AI 的研究時指出:人對 AI 的信任,不是單一感受,也不是只憑「它準不準」就能解釋。信任會受到很多因素影響,例如系統是否穩定、介面是否清楚、呈現方式是否讓人覺得專業、過去使用經驗好不好,甚至連它有沒有一點「像個可以合作的對象」,都會影響我們怎麼看它。

這件事放到研究現場,特別有感。你相信它,不一定是因為你真的驗證過它每次都正確。很多時候,比較像是它呈現出一個值得信任的助手樣子:不急、不亂、會整理、會條列、會把很亂的東西排得乾乾淨淨。於是,在你還沒意識到之前,你就已經先對它放低戒心了。

所以,對 AI 產生信任,從來不只是理性評估後做出的純粹判斷,而是在一次次互動中慢慢累積出來的;也就是說,人不一定是因為 AI 值得信才相信它,有時候,只是因為它表現得很像值得信任。

在質化分析裡,這種信任是怎麼長出來的?

如果把這件事放到質化分析現場,就更明顯了;Hitch 在談 AI 進入質化分析時,重點其實不是「AI 能不能取代研究者」,而是提醒:這類工具可以協助整理、摘要與初步主題生成,但它缺乏對社會脈絡、文化意義與反思思辨的能力,因此不能被當成分析的捷徑。

順著這個提醒往下想,質化分析現場真正麻煩的地方在於:當 AI 開始幫你整理逐字稿、生成初步主題、提供分類架構時,研究者很容易因為這種「已經被理清」的外觀,而逐漸放下戒心。這點在質化分析裡尤其明顯。因為質化分析本來就不是有標準答案的研究類型,它很依賴判斷、取捨,以及你怎麼理解脈絡、矛盾與例外。

想像一個很熟悉的場景:你把逐字稿丟進去,它很快整理出條列重點和摘要;你原本還在一堆雜亂語句裡打轉,它已經幫你列出幾個看起來很像樣的類別;你還在想「這段到底算不算某個概念」,它已經幫你把幾十頁內容收斂成一張乾淨的清單。

這時候,你真的很難不被說服;研究者開始相信 AI,不一定是因為它每次都完全正確。很多時候,反而是因為它太像一個已經幫你理清的人。它把原本一塌糊塗的東西整理得有條不紊,把你還說不清楚的直覺先寫成幾句完整的句子。於是你很容易把它提供的結果,誤認成自己的判斷。

什麼叫合理依賴?什麼叫過度信任?

真正的問題,不是信不信 AI,而是:怎樣算合理依賴,怎樣算過度信任。

合理依賴其實一直都在發生,而且沒有問題。你可以讓 AI 先掃過整體資料,看看哪些主題反覆出現;請它整理一版初步歸納或分類;幫你列出幾個可能的比較方向;甚至把它當成第二雙眼睛,協助發現你原本沒注意到的細節。這些都很好,因為它是在幫你省力,最後的判斷還在你手上。

但是,過度信任就不同了。你直接接受 AI 給你的分類框架;把它的摘要當成自己對研究文獻的理解;還沒重讀逐字稿,就先採納它對某段對話的意義判讀;甚至在自己都還沒形成推論之前,就先讓它替你決定哪些東西重要、哪些東西可以忽略。

這裡真正的差別,不是你用得多不多,而是:你把什麼樣的判斷權交給了 AI ?要知道-合理依賴是借力,過度信任則是失衡。

為什麼過度信任會發生?

過度信任之所以麻煩,不是因為 AI 常常明顯出錯。明顯的 hallucination 反而容易讓人警覺,真正危險的是另一種情況:它沒有錯得很誇張,甚至整理得還蠻像一回事,內容扎實、條理清楚、語氣穩定,還剛好和你的直覺差不多。這時候,人最容易放下防備。

你會想:「這版整理大致可用。」然後就從「先參考一下」慢慢轉變「應該差不多就是這樣」,再往下走一點,內心就會變成:「我其實已經掌握這段內容了。」

但你真的掌握了嗎?還是只是因為 AI 把東西說得太順,所以你不再追問了?現階段最危險的,真的不是它錯得離譜,而是它看起來剛剛好,好到你覺得沒有繼續追問或檢查的必要。

研究者真正不能外包的是什麼?

說到底,問題已經不是「能不能用 AI」,而是哪些工作你可以放心交給它,哪些不行?有些工作的確很適合交給 AI 處理,像是初步資料彙整、內容摘要、整理比較表、產生候選分類、協助腦力激盪並收斂想法等。這些地方,AI 很有價值,也真的能省下不少力氣。

但有些事情,研究者最好不要外包,例如:

  • 決定哪個分類真的有意義
  • 判斷哪個概念值得留下
  • 辨認例外、矛盾與反例
  • 對引用、詮釋與結論負責

這些事情之所以不能外包,不是因為 AI 完全做不到,而是因為一旦這些判斷不再由你承擔,你的研究也就不再真正是你的研究;所以說白了,研究者真正不能外包的,不是輸入文字,而是判斷與承擔

陪你做研究的最後

信任AI 所衍生的問題,從來不只是準不準而已;真正麻煩的是:你自己有沒有意識到,現在是基於什麼理由在相信它?一個成熟的研究者,從來不是完全不信或不使用工具,而是知道什麼時候可以借助工具帶來的便利,也知道什麼時候必須把判斷權收回來。

你可以讓 AI 幫你整理、幫你歸納、幫你發掘一些原本沒看見的東西;但你不能讓它替你決定:哪些東西值得相信、哪些概念值得留下、哪些結論可以寫進你的研究裡。

到最後,真正需要被調整的,不只是 AI 的輸出品質,還有你自己對 AI 的信任分寸;因為研究者最需要保住的,不是摘要能力,不是整理速度,甚至不只是閱讀量,而是:我知道這段話看起來很對,但我還沒決定要不要相信它。

參考資料

Glikson, E., & Woolley, A. W. (2020). Human Trust in Artificial Intelligence: Review of Empirical research. Academy of Management Annals, 14(2), 627–660. https://doi.org/10.5465/annals.2018.0057

Glikson, E., & Woolley, A. W. (2020). Human Trust in Artificial Intelligence: Review of Empirical research. Academy of Management Annals, 14(2), 627–660. https://doi.org/10.5465/annals.2018.0057

 

推廣組 柯文仁 / 本文搭配 AI工具 進行寫作輔助。