Lawsnote爬蟲案重創法學圈:創辦人判刑、1億賠償掀台灣科技法源爭議

2025年6月30號前幾日,台灣科技與法律圈震撼不已。關於網路爬蟲技術的著作權訴訟,不僅讓知名法律科技新創 Lawsnote 的創辦人分別被判刑 4 年,更面臨超過新台幣 1 億元的鉅額賠償。此案成為台灣史上首例因使用網路爬蟲技術遭重罰的案例。

網路爬蟲早已深植於現代數位世界,不論是搜尋引擎建構索引、比價平台抓取價格、AI 模型建立訓練資料,都無不倚賴此技術。然而,Lawsnote 的判決為這項通行於各行各業的工具敲響警鐘——當爬蟲技術觸及法律灰地帶,創新者可能面臨刑責與天價賠償的雙重風險。

什麼是網路爬蟲?

網路爬蟲(Web Crawler)是一種程式,自動模擬使用者在網頁上的瀏覽行為,從公開網站中提取資料。它會循著超連結一頁頁地爬行,並將所擷取的資料儲存、分析。常見的爬蟲類型包括靜態網頁爬蟲(以HTML結構為主)與動態爬蟲(需處理JavaScript渲染頁面)。

網路爬蟲的應用場景

爬蟲技術廣泛應用於多種場域:搜尋引擎如 Google 利用爬蟲建立索引;電商網站使用爬蟲追蹤價格異動;金融科技公司蒐集公開財報資訊;法律新創則用爬蟲抓取判決書或法條文本;甚至許多生成式 AI 訓練資料來源也仰賴網路爬取行為。

Lawsnote 案的來龍去脈

Lawsnote 成立於 2016 年,自詡為「法學版 Google」,透過網路爬蟲技術,自動蒐集公開的法律資料,如法規條文、歷史沿革、附件與裁判書,並搭配搜尋與 AI 功能,提供法律工作者與學生便捷的資料查找工具。

法源提出的訴訟

法源資訊公司於 2021 年提起訴訟,主張 Lawsnote 未經授權擷取其網站資料,特別是編輯過的「法規沿革」內容。法源認為該資料屬於具創作性的編輯著作,受著作權法保護。

法院的判決結果

法院一審採信法源說法,認為「法規沿革」具備資料選擇與編排的創作性,屬於編輯著作。判決 Lawsnote 兩位創辦人分別處以 4 年與 2 年刑期,並連帶賠償新台幣 1 億 545 萬餘元。法院更指出,創辦人未對侵權行為表達歉意,亦無悔意,影響量刑。

網路爬蟲的法律風險分析

著作權法

依據台灣著作權法第9條,法律、命令及公文原則上不得為著作權標的。然而法院認定「法規沿革」雖屬法律資訊,但經過人工編撰與編排,具備創作性,屬於可受保護的編輯著作。這樣的認定,開啟了公共資訊與私營編輯權限之間界線的爭議。

在合理使用方面,美國法庭普遍會檢視使用目的與性質、使用部分占原著比例、市場影響等,而歐盟與新加坡等地亦開始針對 TDM(文字與資料探勘)設豁免條款,前提是資料須合法取得。

刑法:無故取得電磁紀錄罪

法院依刑法第360條,認定 Lawsnote 使用爬蟲「未經授權」,構成「無故取得他人電腦電磁紀錄罪」。這一罪名原本是針對駭客行為設計,首次被套用在業界普遍使用的爬蟲技術上,引發學界對於其適用範圍的高度關注。

個人資料保護法

雖然本案與個資無直接關聯,但若爬蟲抓取涉及個資(如用戶帳號、聯絡資訊等),仍可能違反個資法規定。企業使用爬蟲時應格外注意資料是否含有識別個人身分的內容。

網站服務條款

多數網站明文禁止未經授權的自動化爬蟲抓取行為,違反條款可能導致法律訴訟或帳號封鎖。即便條款並非刑法條文,其仍構成民事契約的一部分,常作為法院判斷「未經授權」的依據之一。

網路爬蟲的合法使用指南

取得授權

與網站管理者主動溝通、申請 API 存取或簽署授權契約,是最安全且合法的方式。即使是公開資訊,若網站對資料做了特別整理與加工,仍應視為潛在著作權標的。

遵守 Robots.txt 協議

Robots.txt 是網站設定爬蟲抓取行為的技術規範。合法爬蟲應先檢查該檔案,避免抓取被標示為禁止的區段。

避免過度抓取

即使對方網站未禁止爬蟲,也應控制抓取頻率與範圍,避免造成網站流量異常,否則可能構成妨礙業務或惡意行為。

尊重資料來源

引用來源不僅是道德責任,也有助於釐清資料使用的法律責任歸屬。無論是否屬於著作物,適當註明資料來源有助於避免侵權爭議。

Lawsnote 案成為台灣科技法律史上的關鍵里程碑。它不僅彰顯爬蟲技術在法律邊界上的爭議,也警示創業者在資料應用上務必審慎評估法律風險。尤其在生成式 AI 與大數據分析持續推進的時代,如何取得資料、如何使用資料、是否合法取得,已不再是單純技術問題,而是創業成敗與自由身家之爭。

面對此案的爭議,政府應加速釐清公共資料與著作權的界線,制定合理且具前瞻性的資料使用政策。期望未來能建立一個既鼓勵創新又保障權益的數位生態,讓科技與法治並行不悖,共同前行。

參考:【評論】為什麼是「判4年、賠1億」?Lawsnote侵權案對創新、創作、爬蟲的4個思考|Meet創業小聚