自然语言处理数据集免费资源开放(附学习资料)
在你刚开始入手自然语言处理任务时,你需要数据集来练习。
最好是使用小型数据集,这样你可以快速下载,也不用花费很长的时间来调试模型。同时,使用被广泛使用和了解的标准数据集也是有所帮助的,你可以用你的结果来做比较,看一下是否有所进步。
在这篇博文中,你会找到一系列标准数据集来开始你的深度学习之旅。
总览
这篇博文被分成七个部分,它们是:
1. 文本分类(Text Classification)
2. 语言模型(Language Modeling)
3. 图像字幕(Image Captioning)
4. 机器翻译(Machine Translation)
5. 问答系统(Question Answering)
6. 语音识别(Speech Recognition)
7. 自动文摘(Document Summarization)
我已经尝试提供一系列被广泛