ChatGPT背後竟藏血汗工廠！時薪不到2美元，員工遭受持久心理創傷

最後更新時間： 02/15/2023 11:19

近期大熱的 AI聊天機器人 ChatGPT被譽為當年最具創新性的人工智慧工具之一，掀起了一場 AI 狂歡，然而，該程式背後卻有著鮮為人知的黑暗面。外媒爆出，為了訓練ChatGPT，OpenAI僱傭了時薪不到2美元的肯尼亞外包勞工，他們所負責的工作就是對龐大的數據庫手動進行數據標註。而這些勞工因長時間接觸色情與殘酷內容的字句文本，而留下心理創傷。

這讓人們在欣喜 AI 技術發展的同時，也不由思考，生成式AI煉成的背後是否會製造出更多的血汗工廠。

ChatGPT 智能化的背後：廉價的非洲血汗工

於2022年11月發佈的ChatGPT被譽為當年最具創新性的人工智慧工具之一。

這項強大的AI聊天機器人幾乎可以生成任何問題的文本，從莎士比亞的十四行詩，到用5歲孩子都能理解語言描述的複雜數學問題，可謂「無所不能」。

》》》火爆全網的聊天機器人ChatGPT是什麼？怎麼用？有望取代Google嗎？

》》》ChatGPT背後開發商OpenAI是誰？僅18個月就晉級獨角獸

瑞銀此前發布的一份研究報告顯示，ChatGPT的月活躍用戶在今年1月份預計達到了1億，這距離其推出只有2個月時間，成為史上增長最快的消費者應用。

》》》ChatGPT有多火？工程師也要失業？ChatGPT通過三級工程師面試，年薪達549萬台幣

然而，在ChatGPT掀起的這場人工智慧「革命」和資本市場狂歡的背後，有一個被邊緣化的、被遺忘的卻又至關重要的群體，值得所有人關注，他們就是數據標註員 。這份工作除了薪資被剝削外，也需長時間接觸性虐待、獸交、酷刑和亂倫等文本，因此留下心理創傷。

從當下看來，OpenAI已經成為「生成式人工智慧」行業無可爭議的領頭羊。

最樂觀的投資者認為，計算機生成的文本、圖像、視頻和音頻將改變無數行業的經營方式，從創意藝術到法律，再到計算機編程，該技術都將提高人類的工作效率。

然而，數據標籤員工的工作條件揭示了行業背後「黑暗」的部分：儘管人工智慧魅力無限，但它往往依賴於全球最廉價的勞動力，他們往往被大幅剝削。儘管他們為數十億美元的產業作出了傑出貢獻，但這些幾乎「隱形」的工人仍然處於最邊緣的地帶。

時薪僅 2 美元的數據標註員，清除暴力、歧視等言論

據美國《時代周刊》上月中旬的報導，為了訓練ChatGPT，OpenAI 從 2021 年 11 月僱傭了時薪不到2美元（時薪僅約台幣40元）的肯尼亞外包勞工，他們所負責的工作就是對龐大的數據庫手動進行數據標註。其中大部分文本似乎從暗網中提取，內容包括兒童性虐待、獸交、謀殺、自殺、酷刑、自殘和亂倫等可怕內容。

《時代周刊》查閱的文件顯示，OpenAI在2021年底與Sama簽署了三份總價值約20萬美元的合約，為數據庫中有害的內容進行標記。

Sama是一家總部位於舊金山的公司，在肯亞、烏干達和印度僱用員工為 Google、Meta 和微軟等矽谷客戶標記數據，並自詡為一家「有道德的 AI」公司，並聲稱已幫助 50,000 多人擺脫貧困。

然而事實卻是，Sama 在訓練 ChatGPT 的項目中，大批僱傭了時薪不到 2 美元的肯亞勞工，他們所負責的工作是對龐大的數據庫手動進行數據標註。據《時代雜誌》採訪的三名員工表示，他們在 9 個小時的工作時間內，要閱讀和標註 150~200 段文本，這些文本的範圍從 100 個單字到 1000 多個單字不等；計算後，平均每小時他們最多要閱讀和標註超過 2 萬個單字。

另《時代雜誌》在審查了內部文件後指出，OpenAI 在 2021 年底與 Sama 簽署了三份總價值約 20 萬美元的合約，專為性虐待、仇恨言論和暴力等惡意內容進行標記；合約規定，OpenAI 將為該項目向 Sama 支付每小時 12.5美元的報酬，但數據標註員的實際時薪卻僅有 1.32 美元至 2 美元之間（約新台幣 39.9 元 ~ 60.5 元），具體時薪取決於資歷和表現。

據Sama員工透露，「代理商」是三個小組中最初級的數據標籤人員，他們的基本工資為每月2.1万肯尼亞先令（約170美元、新台幣5,140元）。此外，他們每月還能獲得約70美元的獎金，如果達到準確性和速度等關鍵績效指標，他們還可以獲得佣金。

按此計算，一名每天工作9小時的員工預計稅後時薪至少能拿1.32美元，如果超額完成所有目標，則最高可達到1.44美元（約新台幣43.5元）。質量分析師是資歷更深的數據標籤員工，他們的工作是檢查「代理商」的工作，如果他們達到了所有績效目標，時薪可以拿到2美元。

公開資料顯示，肯尼亞並沒有統一的最低工資標準，但當這些外包員工受僱時，肯尼亞首都內羅畢的最低時薪是1.52美元。

據《時代周刊》報導，Sama的一名發言人在一份聲明中稱，公司對工人的要求是在9小時的工作中標註70段文字，而非200段。此外，工人們的稅後時薪是1.46美元~3.74美元，不過這位發言人拒絕透露哪類崗位會達到其所述時薪區間的上限。

OpenAI的一位發言人則在另一份聲明中稱，該公司沒有發布任何的業績目標，且外包員工的工資和心理健康由Sama的管理層負責。

員工心理創傷嚴重，心理治療師形同虛設？

《時代雜誌》也採訪了參與 ChatGPT 項目的四名 Sama 員工，這些員工都表示，該工作給他們留下了持久的心理創傷。

有一位負責為 OpenAI 閱讀和標記文本的工作人員告訴記者，他在閱讀了一名男子在幼兒在場的情況下與狗發生性關係的文本後，反覆出現幻覺。他表示：

那是一種折磨，整個星期你都會讀到很多這樣的內容，週五放假的時候，你會因為想到那張照片而感到不安。

儘管他們有權參加健康諮詢師課程，但四人都表示，由於對工作效率的要求很高，他們只能選擇參加小組會議。其中還有一人表示，他們要求以一對一的方式與心理諮詢師會面的請求，被Sama管理層多次拒絕。

OpenAI 與 Sama 結束合作

2022年2月，Sama開始為OpenAI的另一個項目進行試點工作，但工作內容根據美國的法律是非法的。儘管這項試點工作似乎與ChatGPT無關，但僅僅在幾週之內，Sama便叫停了與OpenAI的所有項目，比合同中約定的時間提前了8個月。

Sama當時在一份聲明中稱，其為OpenAI收集的圖像協議中不包括任何涉及非法的內容，直到相關工作開始後，OpenAI才發來「附加指示」，提到了「一些非法的類別」，隨後肯尼亞團隊的高管立即提出了擔憂並結束了該項目。

ChatGPT 閃耀的背後是依賴全球最廉價的勞動力，這些數據標註員被大幅剝削且留下精神創傷，卻鮮為人知，近期才藉由 OpenAI 與 Sama 的事件，順勢揭露人工智慧仍須依賴大量勞動力的黑暗事實。

AI 模型內的歧視與偏見

由於運算愈來愈便宜、蒐集資料成本和難度愈來愈低，再加上演算法的進步，這些因素都讓人工智慧的威力大幅上升，產出的模型連帶增強許多，無論是以文生圖的Midjourney、DALL·E 2，還是能夠跟人類對話的ChatGPT，都受益於上述趨勢，有著令世人驚艷的表現。

不過，因為人工智慧模型需要經過反覆訓練，迭代測試後不斷改善，這個過程大幅仰賴訓練集的資料，而這些資料又是出自於人類的日常生活當中，因此產出的服務，無可避免會複製人類社會中常見的偏見。

例如，Google搜尋有過在自動完成建議（autocomplete suggestions）中特定族群與負面形容詞綁定的紀錄，又或者是搜尋特定職業如醫生的圖片時，白人男性出現的照片不成比例地高，隱含醫生都是白人男性的刻板印象，忽略早就有許多女性與多元種族擔任醫生的事實。

另外，2020年韓國企業Scatter Lab曾推出聊天機器人Iruda，2016年微軟也介紹了聊天機器人Tay，兩款人工智慧服務都會從與使用者的對話中學習，改善自己的表現。然而，正因為這個特點，聊天機器人上線沒有多久，很快學會了種族歧視與性別歧視，甚至會講仇恨言論，Scatter Lab和微軟都在問題爆發後無奈將機器人下架。

為了避免出現上述情形，企業們也用各自的方式改善問題，例如請研究人員開發在模型中減少偏見，甚至全面消除歧視的方法，又或者從源頭解決—也就是從訓練資料下手，根本性的排除問題。

生成式AI煉成的背後令人擔憂

ChatGPT的前身GPT-3已經展示了非常強大的語句串聯的能力。然而，當時的GPT-3卻存在很多弊端，例如內容容易出現暴力、性別歧視等言論。之所以會出現這樣的不足之處，是因為AI工具從互聯網抓取了數千億個單詞來訓練，這也是一把雙刃劍——由於互聯網的詞彙有不少帶有偏見及負面的詞彙，因此單純憑藉學習能力無法來清除這些訓練數據。

《時代周刊》的報導顯示，即使是一個由數百人組成的團體，也需要幾十年的時間才能手動搜索龐大的數據庫。OpenAI只能透過建立一個額外的、AI驅動的安全機制，才能控制上述弊端，創造出適合人們日常使用的聊天機器人。

據報導，為了建立這個安全系統，OpenAI借鑒了Facebook（現Meta）等社交媒體公司的做法。此前，Facebook已經證明其可以構建能夠檢測仇恨言論等的AI工具，並將這些內容從其平台上移除。這項工作也很簡單：給AI提供標有暴力、仇恨語言等標籤，AI工具就可以學會檢測這些內容。目前類似的工具已經內置到ChatGPT當中，以檢測它是否與訓練數據的內容相呼應，並在它觸及到用戶之前將不良內容過濾掉。

《時代周刊》報導稱，為了獲得這些有害內容的標籤，OpenAI從2021年11月開始便向一家外包公司發送了數萬條文本片段。其中大部分文字似乎都是從互聯網「最黑暗的角落」挖掘出來的。

據報導，OpenAI發言人曾在一份聲明中證實，Sama在肯尼亞的員工為該公司正在開發的監測有害內容的工具作出了貢獻，該工具最終被內建到ChatGPT中。

除了OpenAI，Sama還為谷歌、Mate和微軟等矽谷科技巨頭標註數據。此外，Sama還標榜其是一家「有道德的人工智能公司」，並稱其已經幫助5萬多人脫貧。

人工智慧組織聯盟Partnership on AI表示，「儘管這些豐富數據的專業人士發揮了基礎作用，但越來越多的研究表明，這些工人都面臨著不穩定的工作條件。這可能是慶祝技術效率提升的同時，試圖掩蓋人工智慧對龐大勞動力依賴的結果。」

相關閱讀：

聊天機器人ChatGPT怎麼玩？ChatGPT註冊、操作和應用教學

ChatGPT用途探索丨可幫寫代碼、寫加密貨幣論文；其回答真的可靠嗎？

不懂代碼也能發幣？用ChatGPT創建新Token步驟教學

ChatGPT的現狀和未來前景如何？2023年關於AI發展的7個預測

迎戰 ChatGPT，Google 將推 AI 聊天機器人 Bard

微軟整合OpenAI ChatGPT，推AI搜索引擎新Bing！如何操作和使用？

谷歌聊天機器人bard答錯1問題，拖累Google股價狂瀉近8%，蒸發千億美元