人工智能代筆正在滲透到科學領域——這是一件壞事嗎?
哪些詞語會洩露AI的秘密? 一項對PubMed上超過1500萬篇生物醫學摘要的新研究發現,2024年發表的科學論文中至少有13.5%的論文使用了AI輔助寫作工具,其中最引人注目的是OpENAI的ChatGPT。
這 學習西北大學和圖賓根大學赫蒂腦健康人工智能研究所的研究人員發現,2024年與人工智能生成的寫作相關的詞彙模式急劇上升。 這些詞彙既包括不常見的詞彙,例如“delves”、“undersCOREs”和“showcasing”,也包括較為常見的詞彙,例如“potential”、“findings”和“crucial”。
為了衡量這種變化,研究人員將 2024 年的詞頻與 2021 年和 2022 年的基線數據進行了比較。 他們最終確定了 454 個經常被人工智能模型過度使用的詞,包括“encapsulates”、“noteworthy”、“undersCore”、“scrutinizing”和“seamless”。
然而,專家解釋說,解密單憑詞頻還不足以證明人工智能的使用。
“語言會隨著時間而改變,”加州大學聖地亞哥分校傳播學助理教授斯圖爾特·蓋格(StuARt Geiger)說道。 “‘Delve’一詞的流行度飆升,如今已成為社會常用詞彙,部分原因在於ChatGPT。”
蓋格強調,在寫作中檢測人工智能不僅僅是一個技術挑戰,這也是一個道德挑戰。
“合理檢測法學碩士申請情況的唯一方法就是在場監督寫作過程,”他說。 “但這在後勤、道德和技術方面都成本高昂。”
然而,斯圖爾特警告說,在不了解全部背景的情況下,不要僅根據表麵線索就妄下結論。
“他們可能只是看了一堆 ChatGPT 生成的文字,就覺得這就是好文章的樣子,”他說。 “這正是我們學術界一直在努力解決的問題,尤其是當我們無法讓學生直接坐在座位上,確保只用紙筆進行寫作的時候。”
隨著人工智能生成的文本變得越來越普遍,教育工作者已經轉向聲稱可以檢測它的工具;然而,這些工具的質量各不相同。
2024年10月,解密經過測試領先人工智能檢測工具——包括 Grammarly、Quillbot、GPTZero 和 ZeroGPT。 結果差異很大:ZeroGPT 聲稱《美國獨立宣言》97.93% 是由人工智能生成的,而 GPTZero 則認為只有 10%。
蓋格說:“有很多騙人的鬼油在賣。”
蓋格表示,對人工智能寫作工具的擔憂與過去關於拼寫檢查、維基百科和 CliffsNotes 的爭論如出一轍,並反映了關於寫作目的、作者身份和信任的更深層次的問題。
“人們擔心,當你必須自己寫這些文字時,你必須仔細思考,”他說。 “這就是為什麼當人們看到一些可疑的東西時,反應如此強烈。”
萊斯大學商學院教授凱瑟琳·珀利認為,雖然人工智能寫作常常會呈現出一些模式,例如重複的結構或像“delve”這樣被過度使用的詞語,但最重要的是它能否在不影響質量的情況下幫助研究人員。 她表示,對於非英語母語人士或面臨其他挑戰的人來說,這一點尤其重要。
“如果人工智能能夠幫助研究人員克服語言障礙或學習障礙等挑戰,並且不會損害其工作的原創性或質量,那麼我認為它沒有問題,”她告訴解密“我認為這可能是一個整體的好處,因為它允許具有不同背景、想法和經歷的人參與到一些可能因缺乏正式寫作技能而成為障礙的事情中。”
作為萊斯商學院院長的人工智能顧問,珀利指出,另一個困境是人們傾向於改變自己的寫作方式,因為擔心被指責使用人工智能。 她補充說,她已經更加意識到某些詞語可能會被標記為可能是人工智能生成的。
儘管有些人批評這種風格缺乏個性,但 PErley 認為人工智能輔助寫作是一種可以使正式研究參與民主化的工具。
“當然,我們可能會看到更多‘深入研究’和破折號,”她說,“但如果人工智能能夠幫助不同背景的人們分享重要的研究成果,我不在乎它聽起來多麼完美——它都是值得的。”