自然语言处理数据集免费资源开放(附学习资料)
在你刚开始入手自然语言处理任务时,你需要数据集来练习。 最好是使用小型数据集,这样你可以快速下载,也不用花费很长的时间来调试模型。同时,使用被广泛使用和了解的标准数据集也是有所帮助的,你可以用你的结果来做比较,看一下是否有所进步。 在这篇博文中,你会找到一系列标准数据集来开始你的深度学习之旅。 总览 这篇博文被分成七个部分,它们是: 1.文本分类(Text Classification) 2.语言模型(Language Modeling) 3.图像字幕(Image Captioning) 4.机器翻译(Machine Translation) 5.问答系统(Question Answering) 6.语音识别(Speech Recognition) 7.自动文摘(Document Summarization) 我已经尝试提供一系列被广泛