糟糕,有東西出錯了!

若您繼續編輯,資料可能會遺失


到目前為止您的編輯資料都有正確更新,但系統在執行您剛剛最後一個的編輯時出了些差錯。因此,若您繼續編輯,接下來的改動可能會因無法存檔而遺失。

會發生這個問題有可能是因為網路狀況不穩、主機崩潰或是您運氣不好踩到了程式的 Bug ,建議您確認一下網路的狀況,若問題持續未改善,請 直接聯繫我們 看看我們能否盡快為您排除這個問題。


重新載入
聯繫我們
與主機的連線中斷了,嘗試重新連線 ...

TW-Bench 給大語言模型的台灣考題

編輯
分享
網址已拷貝
提案人
AGIB

本專案主旨為創建一套屬於臺灣人的 Benchmark,圍繞以下三大核心展開計劃:

【建立符合臺灣在地化現狀的基準】

能否真實反映臺灣在地化現狀是評測基準的關鍵考驗。我們提出一種能夠涵蓋多方面向及觀點的方法來構建此測試資料集,計劃邀請各領域專家參與討論,進一步完善這套方法論。

【建立多元且可持續更新測試資料集的機制】

透過開放公眾參與的策略,結合實體工作坊活動與網站平台,邀請來自不同背景的民眾及專家共同貢獻,從生活化的常識到專業領域的測試資料。

【建立透明且公正的評測制度】

由公眾參與開放式審議資料集,民主化測試資料集建置的過程,也會定期以CC0授權的方式釋出明題與暗題,確保開放的基準能夠被持續改進。

提問的標題

提問的簡短描述 ...


討論提問

若您對這個提案有任何的問題或建議,都歡迎在這裡提出與提案人討論喔!

刪除
啟用 Markdown 語法 ( 語法說明 )
預覽
送出留言