6,294 頁資料，怎麼真的做成一篇論文？

柯文仁

24 分鐘前

6,294 頁資料，怎麼真的做成一篇論文？

從街頭潮流研究，看大型數位檔案如何被蒐集、分期、編碼與理論化

剛開始寫論文時，很多研究生最怕的是：資料不夠；資料庫查了一輪又一輪，關鍵字改了好幾版，還是覺得手上的材料太少太薄弱；於是你繼續蒐集：書籍、期刊文獻、會議論文、博碩士論文、政府公報、研究報告，能下載的先下載，可能有關的先放進資料夾。

一段時間後，從原本「找不到資料」的焦慮，進化成另一種階段：資料好像太多了；每一份都和題目有一點關係，刪掉好像很可惜，待讀清單越來越長，資料夾也從「論文資料」，逐漸分裂成「論文資料_新版_PRO_MAX」。

此時真正的問題，已經不是還能去哪裡找資料，而是：

哪些材料真的能回答研究問題？
不同來源要怎麼整理與比較？
哪些內容值得納入文獻回顧？
又要怎麼從大量資料，走到一套可以被交代的研究論述？

研究資料一多，資料夾內的文獻似乎幻化成開放世界地圖：到處都有任務標記，而真正的主線任務，反而越來越模糊。

Pierre-Yann Dolbec 發表於 Journal of Marketing Research 的研究，正好提供一個很值得拆解的案例。為了解釋街頭服飾生產者如何進入高級時尚，作者分析了 6,294 頁縱向檔案資料，並搭配線上論壇的長期參與觀察、相關書籍、Podcast、品牌與設計師資料，以及產業報告。

這篇研究真正值得看的，不只是 streetwear 如何進入 high fashion，而是：

研究者如何讓六千多頁資料，真的開始工作？

本文暫以「多模態數位觀察」稱呼這類結合線上觀察、多來源檔案與不同媒介材料的研究規劃。這只是方便本文討論的操作性稱呼；更白話地說，Dolbec 蒐集不同來源、跨越多年累積的檔案資料，並透過詮釋性分析，重建街頭服飾與高級時尚之間的長期變化。

不是資料越多越好，而是每種資料都要有工作

Dolbec 並沒有把所有材料倒進同一個資料夾，再從第一頁一路讀到最後一頁；研究者在三個分別聚焦高級時尚、街頭服飾與奢華街頭服飾的網路論壇進行線上參與觀察，觀察期間分別為 78、37 與 17 個月；作者再搭配 18 本相關書籍，建立對時尚市場與不同文化場域的理解。

主要的 6,294 頁檔案資料又分成幾種用途：

- 市場層次資料，用來辨認時間階段與市場機制；
- 品牌與設計師資料，用來分析生產者採取了哪些行動；
- 特定事件資料，用來補強分析過程中浮現的現象。

此外，產業報告則用來追蹤併購、市場成長等變化。

作者也納入街頭文化媒體、時尚媒體、產業媒體與主流媒體，並蒐集 55 集 Podcast，希望讓不同市場位置的行動者、記者、評論家與分析者彼此對照。這裡的三角檢證，不是看哪個觀點票數最多，而是觀察不同位置如何描述同一場變化，又在哪裡出現共識、落差與衝突。

這裡最值得研究生學習的，不是「資料來源要很多」，而是：

先做資料地圖，再做資料蒐集。

每一類材料都要能回答：它代表誰的觀點？能回答研究問題的哪一部分？可能存有什麼偏誤？又能和哪些資料互相核對？當整張研究地圖上都是驚嘆號，不代表每一個任務都要接，研究設計並不是以達成「全成就蒐集」為目標，資料也不是抓越多越接近頂刊之流。

順帶一提，本文中所稱「頁數」，也並非文件原始的計量單位，研究團隊先將文章與逐字稿統一整理成 Times New Roman 12 號、單行間距的 Word 文件，再依此計算頁數。，因此，6,294 頁主要是在呈現資料規模，不一定適合直接拿來和其他研究相比。

第一個關鍵：不是按年份切段，而是看市場關係何時改變

面對橫跨多年的資料，Dolbec 不是把材料平均分成幾個年代，而是先以歸納方式比較不同時期的媒體報導、評論與市場行動，觀察 streetwear 與 high fashion 的關係何時出現明顯轉變。

最後形成三個階段：

1. 挪用（cooptation）：高級時尚借用街頭風格，但街頭生產者仍被排除在菁英類別之外。
2. 混種（hybridization）：luxury streetwear 結合街頭文化與高級時尚的生產、展示和定價方式，逐漸形成可被辨認的新類別。
3. 吸納（subsumption）：高級時尚透過聯名、聘任、投資或收購，把混種類別及其生產者納入原有體系。

換句話說，作者不是看「哪一年到了」，而是看主導關係是否改變：從高級時尚借用街頭元素，到混種類別形成，再到高級時尚品牌重新掌握類別邊界與市場控制權；論文沒有提供一套可直接複製的切段公式，但可以看出，作者是透過反覆比較不同時期的材料，辨認市場互動機制何時發生轉換。

資料量不是說服力。真正有分析價值的，是研究者能否指出：現象在哪裡翻轉，以及為什麼那個轉折值得被切成新的階段。

第二個關鍵：不是每一頁都用同一倍率閱讀

大型檔案研究不代表每一份資料都要用相同深度處理，Dolbec 先透過論壇廣告與品牌銷售據點，辨認出 136 家精品零售商；接著蒐集其中最常出現的 20 個品牌與設計師資料，最後再聚焦到 11 位對研究現象特別重要的 luxury streetwear 設計師。研究團隊也先為這些設計師整理專業生涯資料，再進行深入分析。

這個流程可以理解成三種閱讀倍率：

廣角閱讀，用來建立市場全貌；
中距閱讀，用來辨認重要品牌與行動者；
近距閱讀，才進入關鍵設計師的細緻編碼。

研究不是要把地圖上的每個角落都探索完，而是要能清楚交代：為什麼某些資料用來建立全貌，哪些行動者又值得進一步深讀。

第三個關鍵：編碼不是把資料變短

聚焦到 11 位設計師後，Dolbec 先進行描述性編碼，例如：

「在義大利生產」
「大量使用社群媒體」
「與藝術家合作」

接著，他在這些描述碼之間尋找模式，並在不同設計師、不同時期之間進行比較，再結合制度分類的理論視角，逐步形成更高層次的主題與總括構面，像是「建立可比較性」。

也就是說：

摘要，是回答這段資料說了什麼；
編碼，是判斷它和研究問題有什麼關係；
分析，則是解釋不同編碼是否存有關聯性，以及如何共同形成一個現象。

編碼不是把資料變短，而是把資料轉成可以回答研究問題的分析單位。

分析不是直線：資料與理論會反覆來回

到了這一步，Dolbec 採取溯因分析（abductive analysis）：一方面從資料中辨認模式，另一方面也借助既有理論理解這些模式。這個來回，進一步讓研究問題逐漸聚焦；這個來回也讓研究問題逐漸聚焦。作者在檢視市場塑造文獻時，發現「非菁英生產者如何跨入既有菁英類別」仍缺少充分解釋，因此重新分析 luxury streetwear 生產者的資料。

當分析顯示許多設計師經常引用藝術，但現有材料不足以深入說明這個現象時，研究團隊便補蒐特定事件資料，例如 Virgil Abloh 如何使用引號作為設計元素。產業報告則被用來補強併購、市場成長等市場層次的發現；研究不是先把所有資料蒐集完，再依序跑完編碼與理論。很多時候，是初步分析指出問題，理論協助重新提問，新的問題再帶著研究者回去補充資料。

把上述步驟串起來，大致可以整理成：

初步蒐集、時間分期、引入理論視角、聚焦關鍵設計師、描述性編碼、跨設計師比較、辨認資料缺口、補充資料，再重新分析。

這不是研究失控，而是分析正在推進。

6,294 頁，不是靠讀完征服的

Dolbec 這篇研究厲害的地方，不是作者有耐力吞完六千多頁，也不是資料量大到足以直接鎮住審稿委員；真正讓這些材料成為研究的，是他如何替資料分配任務、辨認時間轉折、逐步聚焦關鍵設計師、建立描述性編碼、進行跨設計師比較，再透過理論視角與後續補證，形成能夠回答研究問題的解釋。

所以，當你的研究資料從「好像不夠」，一路長到「好像永遠看不完」時，真正需要的可能不是再下載一百篇，而是先停下來問：

這批資料在我的研究裡，究竟扮演什麼角色？

有些材料用來建立背景，有些協助辨認時間轉折，有些適合深入比較；也有些只是搜尋過程中順手收進資料夾，最後卻沒有真正進入研究主線。

當你開始釐清這些資料的角色，也會進一步檢視資料來源、全文取得、檢索範圍與搜尋紀錄等問題。這正是圖書館能提供支援的地方：不只是幫你找到更多資料，也協助你核對書目、取得全文、確認檢索範圍，以及看見可能被遺漏的資源。若研究者也使用 AI 協助搜尋或整理，這些核對工作更能避免查無實據的「幽靈文獻」混進研究資料庫。

六千多頁資料不會自己長成研究，資料可以很多，來源也可以很廣；但哪些材料值得留下、彼此如何連接，又足以支持什麼論述，仍然要由研究者決定。

參考文獻

Dolbec, P.-Y. (2025). From streetwear to high fashion: How nonelite producers use hybridization to enter an elite category. Journal of Marketing Research, 62(3), 543–564. https://doi.org/10.1177/00222437251314372

推廣組柯文仁 / 本文搭配AI工具進行寫作輔助