5?1460204756

【任务】 关于知识分享社区的数据采集 正常


尹刚添加于 2014-08-04 23:26
请选择具有代表性的,有较大覆盖面的社区为数据源。一定要包括以下几个类型的社区: 1 国内外的资讯类网站 2 博客网站 3 问答网站 4 论坛网站 当然,有些网站可能包含上面四个板块,但每个类型都要在国内外选择一两个旗舰网站。
回复(3)
  • 5?1460204756
    尹刚 9年前

    > gyiang 写到: > 当前各类社区的数量: > 资讯类:国内2、国外1 > 博客:1 > 问答类:7 > 论坛:1 > 其他:1 > 总体数据量不大,去除stackExchange站点群的数据后, > 其余数据相加不足200万。 可以!先让整个系统动起来,然后再横向扩展。 谷崇明等Demo框架差不多时,还是回归爬虫框架吧,你认为呢?

  • 929?1442652660
    甘谊昂 9年前

    当前各类社区的数量: 资讯类:国内2、国外1 博客:1 问答类:7 论坛:1 其他:1 总体数据量不大,去除stackExchange站点群的数据后, 其余数据相加不足200万。

  • 929?1442652660
    甘谊昂 9年前

    正在整理爬取进度

0?1470885445
登录后可添加回复
  • 当前状态 新增
  • 选定优先级 正常
  • 指派给 甘谊昂
  • 里程碑 --
  • 开始日期 2014-08-04
  • 结束日期
  • 预计工时(H) 0.00 小时
  • 完成度 0%
  • 关联Commit

© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号

问题和建议
还能输入50个字符 提交

加入QQ群

关注微信APP


×