申请专栏作者
您的当前位置:主页 > 数据下载 > 文本语料 > 正文

全网新闻文本数据

发布:可思数据 时间:2019-02-20
数据类型:文本语料 热度
★★★☆☆
优质数据 数据定制

文件类型: .zip              文件大小:711 MB

授权方式: 公共开源     发布时间:2019-02-20

数据来源:未知             界面语言:中文

数据介绍:
数据描述 :来自若干新闻站点2012年6月-7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据,提供URL和正文信息

格式说明:
数据格式为
 
<doc>
<url>页面URL</url>
<docno>页面ID</docno>
<contenttitle>页面标题</contenttitle>
<content>页面内容</content>
</doc>
 
注意:content字段去除了HTML标签,保存的是新闻正文文本

下载地址:
请点击下面的广告后下载!

特别声明:

¤ 此数据集库仅供研究和教育用途,不得用于任何商业用途。
¤ 如果您在任何出版物或报告中使用该数据库,则必须添加引用来源。
¤ 版权归作者及所在组织所有。
¤ 如用于商业用途,请联系版权所有人。
¤ 本站数据来源于网络如有侵权请联系我们。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片

Copyright©2005-2019 Sykv.com 可思数据 版权所有    网站地图   联系我们  

人工智能资讯   人工智能资讯   人工智能资讯   人工智能资讯

扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部
扫码入群
咨询反馈
扫码关注

微信公众号

返回顶部