This folder contains the datasets used for X-Class.
Due to size constraints, we uploaded the data to google drive,
[here](https://drive.google.com/drive/folders/1w0g3c0z9eoV-IYHCcA54tBKiNTYJy-3J?usp=sharing)
is the download link. After download, you can unzip the zipped dataset through `unzip -o`.
## Data format
We also describe the dataset format for potential use of new datasets.
All files should be placed in a folder with the dataset's name, in this directory. The files to
include are
- dataset.txt
- A text file containing documents, one per line. We will use BERT's tokenizer for tokenization.
- classes.txt
- A text file containing the class names, one per line.
- labels.txt
- A text file containing the class (index) of each document in `dataset.txt`, one label per line.
All the files should have the exact same names.
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
南开大学计算机学院自然语言处理课程大作业,含Python实现的代码及数据集 复现以下三篇论文: 《Counterfactual Inference for Text Classification Debiasing》 《Incremental Few-shot Text Classification with Multi-round New Classes: Formulation, Dataset and System》 《X-Class: Text Classification with Extremely Weak Supervision》
资源推荐
资源详情
资源评论





























收起资源包目录





































































































共 125 条
- 1
- 2

云哲-吉吉2021
- 粉丝: 4301
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 数据库技术在学位电子注册工作中的运用.docx
- WCDMA-网络规划原则.doc
- 基于web的单片机课程远程实验系统研究设计.doc
- 单片机课程设计数字温度计.doc
- (源码)基于Web技术的简易博客系统.zip
- 实践创新驱动的计算机专业学位研究生培养模式分析.docx
- 地源热泵地埋管系统勘察研究报告范本(桂林光电通信产业园).doc
- 项目开发计划excel模板下载.xls
- 探讨互联网+下计算机专业的创新型人才培养模式应用.docx
- 科技哲学大数据发展简论.docx
- 关于公路施工项目管理问题探究.docx
- 计算机日常使用和维护操作规程.doc
- 当前我国电子商务存在的问题与对策.doc
- 基于微信小程序的教学评价平台设计与实现.docx
- 基于知识图谱与循环神经网络构建推荐系统的研究
- 互联网+时代线上线下混合式教学模式探究.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制

- 1
- 2
前往页