糟糕，有東西出錯了！

若您繼續編輯，資料可能會遺失

到目前為止您的編輯資料都有正確更新，但系統在執行您剛剛最後一個的編輯時出了些差錯。因此，若您繼續編輯，接下來的改動可能會因無法存檔而遺失。

會發生這個問題有可能是因為網路狀況不穩、主機崩潰或是您運氣不好踩到了程式的 Bug ，建議您確認一下網路的狀況，若問題持續未改善，請直接聯繫我們看看我們能否盡快為您排除這個問題。

重新載入

聯繫我們

TW-Bench 給大語言模型的台灣考題

網址已拷貝

提案人

本專案主旨為創建一套屬於臺灣人的 Benchmark，圍繞以下三大核心展開計劃：

【建立符合臺灣在地化現狀的基準】

能否真實反映臺灣在地化現狀是評測基準的關鍵考驗。我們提出一種能夠涵蓋多方面向及觀點的方法來構建此測試資料集，計劃邀請各領域專家參與討論，進一步完善這套方法論。

【建立多元且可持續更新測試資料集的機制】

透過開放公眾參與的策略，結合實體工作坊活動與網站平台，邀請來自不同背景的民眾及專家共同貢獻，從生活化的常識到專業領域的測試資料。

【建立透明且公正的評測制度】

由公眾參與開放式審議資料集，民主化測試資料集建置的過程，也會定期以CC0授權的方式釋出明題與暗題，確保開放的基準能夠被持續改進。

提問的簡短描述 ...