(Chinese Learner Text Correction,CLTC)旨在自動檢測並修改漢語學習者文本中的標點、拼寫、語法、語義等錯誤,從而獲得符合原意的正確句子。近年來,該任務越來越受到關註,也出現了壹些具有商業價值的應用。
現有的評測數據集存在著數據量小,領域單壹,參考答案數目少的缺陷。針對上述問題,蘇州大學、阿裏巴巴達摩院聯合發布了MuCGEC(Multi-Reference Multi-Source Evaluation Dataset for Chinese Grammatical Error Correction)多源多參考中文語法糾錯評測數據集,並依托CCL2022會議展開評測
比賽鏈接: /competitions/567
文本事件抽取旨在將非結構化文本中的事件信息進行結構化,是自然語言處理的重要研究領域。事件檢測作為事件抽取的子任務之壹,旨在從給定文本中識別事件觸發詞(trigger)並將其分類到正確的事件類型,觸發詞指的是標記事件出現的核心詞語或短語,事件類型為數據集中預先定義的類型。
近年來,雖然基於深度神經網絡的模型在事件檢測問題上取得了良好的效果,但同樣受限於深度學習方法對訓練數據集的高質量要求,在數據集存在樣本分布不均衡、數據標註質量欠佳、對抗數據汙染等問題時,模型有效性往往難以得到保證,缺乏魯棒性。
針對上述問題,本次競賽將基於中文領域新聞事件檢測數據集(Field News for Event Detection,FNED)發布高魯棒性要求下的領域事件檢測挑戰,旨在通過競賽促進領域事件檢測模型魯棒性的研究,支撐事件抽取相關技術的落地,並推動相關領域人工智能應用的發展。
本賽題的任務為基於FNED新聞文本數據集實現高魯棒的領域事件檢測,通過機器學習、深度學習等模型開發事件檢測算法,使得模型在樣本分布不均衡、數據標註質量欠佳、存在數據汙染時仍具有良好的性能。
? 輸入 :壹個具有事件信息的句子。
? 輸出 :句子的事件觸發詞和事件類型。
示例 :
? 輸入
? “除了無人機,無人戰鬥車的爆發式展示也是本屆珠海航展的最大亮點之壹?在今年珠海航展上,各大軍工集團紛紛推出了多款具有世界先進水平的無人戰鬥車,讓人目不暇接?珠海航展上展示的無人戰鬥車,炮塔上集成了機槍?反坦克導彈和煙幕彈發射器?”
? 輸出
?“event_mention”: {
“event_type”: “Exhibit”,
“trigger”: {
?“text”: “展示”,
?“offset”: [12, 13]
?}
}
/competitions/561
評價 6-12 年級學生議論文寫作元素的有效性
/competitions/feedback-prize-effectiveness/data
論辯是人類智慧的壹項重要技能,在諸多人類活動中承擔著不可或缺的作用。計算論辯技術關註於機器對人類論辯過程的理解和模仿,廣泛應用於決策輔助、寫作支持和邏輯審查等場景。近年來逐漸成為人工智能研究的新興重要分支。本屆評測關註中、英文辯論賽場景下的論辯挖掘任務,鼓勵參賽者使用計算論辯相關技術對辯論陳詞中的論辯要點等成分進行識別或生成,旨在推動計算論辯相關研究的發展,並試圖為學術界和工業界的研究者以及相關產業的從業者提供良好的溝通交流平臺。在本屆大會中,我們將舉辦第二屆智慧論辯評測項目。
給定壹個論點和壹個候選句子,參賽模型須判斷當前句子是否為支持當前論點的論據。我們也會提供辯題作為輔助參考。輸出有兩種標簽:1表示是論據,0表示非論據。
提供壹對具有互動關系的正、反方單環節辯稿。針對壹方的壹個論點,從5個候選論點中選擇出與給定論點有直接互動關系的壹個。候選集由1個人工標註的互動論點,和同壹辯稿中采樣得到的4個無關論點組成。其中,壹個論點可能包含1個或多個句子。
–評價指標:最高預測的平均準確度 (average accuracy of the top predictions, A) 和平均倒數排名 (average mean reciprocal rank, M)。
針對既定的辯題,由參賽模型自動生成貼合辯題的5個論點。
–評價指標:混淆度(Perplexity),BLUE,ROUGE
–評價指標:論據類別上的F1。
/sharedtask/AIDebater22/index.html