6,294 頁資料,怎麼真的做成一篇論文?
從街頭潮流研究,看大型數位檔案如何被蒐集、分期、編碼與理論化
剛開始寫論文時,很多研究生最怕的是:資料不夠;資料庫查了一輪又一輪,關鍵字改了好幾版,還是覺得手上的材料太少太薄弱;於是你繼續蒐集:書籍、期刊文獻、會議論文、博碩士論文、政府公報、研究報告,能下載的先下載,可能有關的先放進資料夾。
一段時間後,從原本「找不到資料」的焦慮,進化成另一種階段:資料好像太多了;每一份都和題目有一點關係,刪掉好像很可惜,待讀清單越來越長,資料夾也從「論文資料」,逐漸分裂成「論文資料_新版_PRO_MAX」。
此時真正的問題,已經不是還能去哪裡找資料,而是:
哪些材料真的能回答研究問題?
不同來源要怎麼整理與比較?
哪些內容值得納入文獻回顧?
又要怎麼從大量資料,走到一套可以被交代的研究論述?
研究資料一多,資料夾內的文獻似乎幻化成開放世界地圖:到處都有任務標記,而真正的主線任務,反而越來越模糊。
Pierre-Yann Dolbec 發表於 Journal of Marketing Research 的研究,正好提供一個很值得拆解的案例。為了解釋街頭服飾生產者如何進入高級時尚,作者分析了 6,294 頁縱向檔案資料,並搭配線上論壇的長期參與觀察、相關書籍、Podcast、品牌與設計師資料,以及產業報告。
這篇研究真正值得看的,不只是 streetwear 如何進入 high fashion,而是:
研究者如何讓六千多頁資料,真的開始工作?
本文暫以「多模態數位觀察」稱呼這類結合線上觀察、多來源檔案與不同媒介材料的研究規劃。這只是方便本文討論的操作性稱呼;更白話地說,Dolbec 蒐集不同來源、跨越多年累積的檔案資料,並透過詮釋性分析,重建街頭服飾與高級時尚之間的長期變化。
不是資料越多越好,而是每種資料都要有工作
Dolbec 並沒有把所有材料倒進同一個資料夾,再從第一頁一路讀到最後一頁;研究者在三個分別聚焦高級時尚、街頭服飾與奢華街頭服飾的網路論壇進行線上參與觀察,觀察期間分別為 78、37 與 17 個月;作者再搭配 18 本相關書籍,建立對時尚市場與不同文化場域的理解。
主要的 6,294 頁檔案資料又分成幾種用途:
-
- 市場層次資料,用來辨認時間階段與市場機制;
- 品牌與設計師資料,用來分析生產者採取了哪些行動;
- 特定事件資料,用來補強分析過程中浮現的現象。
此外,產業報告則用來追蹤併購、市場成長等變化。
作者也納入街頭文化媒體、時尚媒體、產業媒體與主流媒體,並蒐集 55 集 Podcast,希望讓不同市場位置的行動者、記者、評論家與分析者彼此對照。這裡的三角檢證,不是看哪個觀點票數最多,而是觀察不同位置如何描述同一場變化,又在哪裡出現共識、落差與衝突。
這裡最值得研究生學習的,不是「資料來源要很多」,而是:
先做資料地圖,再做資料蒐集。
每一類材料都要能回答:它代表誰的觀點?能回答研究問題的哪一部分?可能存有什麼偏誤?又能和哪些資料互相核對?當整張研究地圖上都是驚嘆號,不代表每一個任務都要接,研究設計並不是以達成「全成就蒐集」為目標,資料也不是抓越多越接近頂刊之流。
順帶一提,本文中所稱「頁數」,也並非文件原始的計量單位,研究團隊先將文章與逐字稿統一整理成 Times New Roman 12 號、單行間距的 Word 文件,再依此計算頁數。,因此,6,294 頁主要是在呈現資料規模,不一定適合直接拿來和其他研究相比。
第一個關鍵:不是按年份切段,而是看市場關係何時改變
面對橫跨多年的資料,Dolbec 不是把材料平均分成幾個年代,而是先以歸納方式比較不同時期的媒體報導、評論與市場行動,觀察 streetwear 與 high fashion 的關係何時出現明顯轉變。
最後形成三個階段:
-
- 挪用(cooptation):高級時尚借用街頭風格,但街頭生產者仍被排除在菁英類別之外。
- 混種(hybridization):luxury streetwear 結合街頭文化與高級時尚的生產、展示和定價方式,逐漸形成可被辨認的新類別。
- 吸納(subsumption):高級時尚透過聯名、聘任、投資或收購,把混種類別及其生產者納入原有體系。
換句話說,作者不是看「哪一年到了」,而是看主導關係是否改變:從高級時尚借用街頭元素,到混種類別形成,再到高級時尚品牌重新掌握類別邊界與市場控制權;論文沒有提供一套可直接複製的切段公式,但可以看出,作者是透過反覆比較不同時期的材料,辨認市場互動機制何時發生轉換。
資料量不是說服力。真正有分析價值的,是研究者能否指出:現象在哪裡翻轉,以及為什麼那個轉折值得被切成新的階段。
第二個關鍵:不是每一頁都用同一倍率閱讀
大型檔案研究不代表每一份資料都要用相同深度處理,Dolbec 先透過論壇廣告與品牌銷售據點,辨認出 136 家精品零售商;接著蒐集其中最常出現的 20 個品牌與設計師資料,最後再聚焦到 11 位對研究現象特別重要的 luxury streetwear 設計師。研究團隊也先為這些設計師整理專業生涯資料,再進行深入分析。
這個流程可以理解成三種閱讀倍率:
廣角閱讀,用來建立市場全貌;
中距閱讀,用來辨認重要品牌與行動者;
近距閱讀,才進入關鍵設計師的細緻編碼。
研究不是要把地圖上的每個角落都探索完,而是要能清楚交代:為什麼某些資料用來建立全貌,哪些行動者又值得進一步深讀。
第三個關鍵:編碼不是把資料變短
聚焦到 11 位設計師後,Dolbec 先進行描述性編碼,例如:
「在義大利生產」
「大量使用社群媒體」
「與藝術家合作」
接著,他在這些描述碼之間尋找模式,並在不同設計師、不同時期之間進行比較,再結合制度分類的理論視角,逐步形成更高層次的主題與總括構面,像是「建立可比較性」。
也就是說:
摘要,是回答這段資料說了什麼;
編碼,是判斷它和研究問題有什麼關係;
分析,則是解釋不同編碼是否存有關聯性,以及如何共同形成一個現象。
編碼不是把資料變短,而是把資料轉成可以回答研究問題的分析單位。
分析不是直線:資料與理論會反覆來回
到了這一步,Dolbec 採取溯因分析(abductive analysis):一方面從資料中辨認模式,另一方面也借助既有理論理解這些模式。這個來回,進一步讓研究問題逐漸聚焦;這個來回也讓研究問題逐漸聚焦。作者在檢視市場塑造文獻時,發現「非菁英生產者如何跨入既有菁英類別」仍缺少充分解釋,因此重新分析 luxury streetwear 生產者的資料。
當分析顯示許多設計師經常引用藝術,但現有材料不足以深入說明這個現象時,研究團隊便補蒐特定事件資料,例如 Virgil Abloh 如何使用引號作為設計元素。產業報告則被用來補強併購、市場成長等市場層次的發現;研究不是先把所有資料蒐集完,再依序跑完編碼與理論。很多時候,是初步分析指出問題,理論協助重新提問,新的問題再帶著研究者回去補充資料。
把上述步驟串起來,大致可以整理成:
初步蒐集、時間分期、引入理論視角、聚焦關鍵設計師、描述性編碼、跨設計師比較、辨認資料缺口、補充資料,再重新分析。
這不是研究失控,而是分析正在推進。
6,294 頁,不是靠讀完征服的
Dolbec 這篇研究厲害的地方,不是作者有耐力吞完六千多頁,也不是資料量大到足以直接鎮住審稿委員;真正讓這些材料成為研究的,是他如何替資料分配任務、辨認時間轉折、逐步聚焦關鍵設計師、建立描述性編碼、進行跨設計師比較,再透過理論視角與後續補證,形成能夠回答研究問題的解釋。
所以,當你的研究資料從「好像不夠」,一路長到「好像永遠看不完」時,真正需要的可能不是再下載一百篇,而是先停下來問:
這批資料在我的研究裡,究竟扮演什麼角色?
有些材料用來建立背景,有些協助辨認時間轉折,有些適合深入比較;也有些只是搜尋過程中順手收進資料夾,最後卻沒有真正進入研究主線。
當你開始釐清這些資料的角色,也會進一步檢視資料來源、全文取得、檢索範圍與搜尋紀錄等問題。這正是圖書館能提供支援的地方:不只是幫你找到更多資料,也協助你核對書目、取得全文、確認檢索範圍,以及看見可能被遺漏的資源。若研究者也使用 AI 協助搜尋或整理,這些核對工作更能避免查無實據的「幽靈文獻」混進研究資料庫。
六千多頁資料不會自己長成研究,資料可以很多,來源也可以很廣;但哪些材料值得留下、彼此如何連接,又足以支持什麼論述,仍然要由研究者決定。
參考文獻
Dolbec, P.-Y. (2025). From streetwear to high fashion: How nonelite producers use hybridization to enter an elite category. Journal of Marketing Research, 62(3), 543–564. https://doi.org/10.1177/00222437251314372
推廣組 柯文仁 / 本文搭配AI工具進行寫作輔助
