NLPCC是自然语言处理及中文计算领域的国际学术会议。NLPCC?? 2022也将继承往年大会活动优势,组织多种学术活动。就此,思必驰(www.aispeech.com)与千言开源数据集项目(www.luge.ai)联合举办首届“对话文本分析评测比赛”,并发布模拟对话场景数据集。
报名及竞赛详情链接,移步思必驰官方微信平台。
传统文本分析是在篇章级、段落级甚至句子级分析意图、理解内容、挖掘有价值信息,而对话文本分析任务则是在对话中挖掘明显的和潜在的信息。在对话领域,对话角色多变,使句子间的交互关系多样化,对话主题也随之复杂多变,这使得对话文本分析极具挑战。
本次比赛在NLPCC 2022官网发起,现已启动报名并发布训练数据,获奖者不仅可获得NLPCC和CCF-NLP双重认证证书,亦有机会在NLPCC 2022发表论文。
随着语音和对话技术的发展,大量的语音对话数据产生出来,这些数据中蕴含了丰富的价值信息和知识,比如对话参与者讨论的主题、对话的摘要都是近年来学术界和工业界研究的重点。在实际应用中,对销售场景对话信息的深入分析可以提升销售人员的服务质量,也可以评估消费者的购买意愿和兴趣点。
本次比赛以销售领域的对话为基础,提供两个对话领域的典型任务:对话主题抽取 [1],对话文本摘要生成 [2]
对话主题抽取任务,即给定一篇完整客服和客户的文本对话记录,要求从中抽取谈及的主题。
对话文本摘要生成任务,旨在总结销售时关注的问题,以便于销售审核、理解和掌握客户的核心需求。该任务的角色是销售和客户,输入是多轮对话的形式,输出是该对话中客户关注的问题的总结。
以下描述一个具体的样例:
这是取自一个样例片段,对输入的文本,算法需要抽取出主题并生成精简的摘要结果。本赛事将分别采用Micro-F1和ROUGE分数两项指标,综合评估参赛系统的效果。
本赛事获奖者为各子任务的第一名,获奖者将获得NLPCC和CCF-NLP证书。
同时,参赛者也将获得以下福利:
学习交流机会:在赛事群中与参赛者、组织者深入交流;前沿技术实践:在竞赛平台展开前沿的多任务建模实践;精美礼品&参赛证明:正式报名参赛并提交最终结果的队伍每位成员将获得千言数据集精美的定制周边一份,并发放参赛证明。
[1] A Joint Model for Document Segmentation and Segment Labeling.In Proceedings of ACL 2020.
[2] Topic-Aware Contrastive Learning for Abstractive Dialogue Summarization.In Proceedings of EMNLP 2021.
CopyRight@2015-2024 IT手机世界 All Right Reserved
工信备案号:京备A2-2009413
IT手机世界畅享移动互联时代智能智慧新生活