Alican Acar宣布Arxiver的开源
阎荟
2024-10-21 00:00:00
227
Alican Acar宣布Arxiver的开源,这是一个包含138,830篇arXiv研究论文的重要数据集,采用多重markdown格式。
Alican Acar宣布Arxiver的开源,这是一个包含138,830篇arXiv研究论文的重要数据集,采用多重markdown格式。这一资源对研究人员和开发人员来说是一个福音,因为它与Hugging Face数据集库完美集成,可以进行高级的基于文本的操作,如语义搜索、语言建模、问答和摘要。这个数据集以现成的格式提供,为机器学习应用和学术研究开辟了新的可能性,使其成为自然语言处理领域或希望利用大量科学知识库的人的宝贵资产。-Arxiver现在是开源的,允许以多标记格式访问138830篇arXiv论文。
-该数据集可与Hugging Face数据集库一起用于语义搜索、语言模型化、QA和摘要等任务。
-数据集可以在以下网址访问https://t.co/O34rNLkdHs.
版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
评论