評估 ChatGPT 對阻塞性睡眠呼吸暫停的回答以進行患者教育
研究目的
我們評估了 ChatGPT 對阻塞性睡眠呼吸暫停問題的回答質量,以進行患者教育,
并評估了聊天機器人如何被影響正確性、估計的等級水平和答案參考。
方法
ChatGPT 被查詢了 4 次,有 24 個相同的問題。
查詢因初始提示而異:無提示、患者友好的提示、醫生級別的提示以及統計/參考的提示。
答案按層次等級評分:不正確、部分正確、正確、統計或引文正確(“正確+”),或統計和引文均正確(“完美”)。
記錄了 Flesch-Kincaid 等級水平和引文發表年份作為答案。
使用卡方分析按提示類型比較增量分數閾值的響應比例。使用方差分析評估提示類型和年級水平之間的關系。
結果
在所有提示中(n = 96 個問題),69 個答案 (71.9%) 至少是正確的。
至少部分正確 ( P = .387) 或正確 ( P = .453) 的回答比例沒有因提示而異;
至少正確+ ( P < .001) 或完美 ( P < .001) 的回答也如此。
對統計/參考文獻的提示提供了 74/77 (96.1%) 的參考文獻。
患者友好提示的響應平均等級水平 (12.45 ± 2.32) ,低于無提示 (14.15 ± 1.59)、
醫師級別提示 (14.27 ± 2.09) 和統計/參考提示 (15.00 ± 2.26) ( P < . 0001)。
結論
無論提示如何,ChatGPT 總體上都能為大多數有關阻塞性睡眠呼吸暫停的問題提供適當的答案。
雖然提示降低了回答等級水平,但所有回答仍然高于向患者提供醫療信息的公認建議。
鑒于 ChatGPT 的快速實施,睡眠專家可能會尋求進一步審查其醫學素養和對患者的實用性。
(葉妮摘自 J Clin Sleep Med. 2023;19(12):1989–1995.)