第322章有私心的苏小木（2 / 2）

掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

ibm也曾提出了大数据的特点：大量、高速、多样、低价值密度、真实性。

但，大家都不会简单的从这些概念上的东西来进行回答。

良久。

谭凌开口道，“我认为大数据就是数量庞大的任意数据，甚至这些数据本身并没有什么卵用，而且还没什么价值，扔之可惜。”

“当然，大数据其实始终贯穿着人类的历史，从古至今的各种法例都能看到大数据的踪迹。”

“比如连环案件分析？”林唐插嘴道。

也不知道林唐是不是最近看柯南看多了，张口就是连环案件。

其他几人各有回答。

独剩下苏小木沉默不语。

“小木同学，你来说说？”张可点了名。

苏小木简单的答道，“说不好，我觉得大数据无非就是多维分析，最终针对的还是人。”

“每个人都有每个人对大数据的理解，我们的课题只是从大数据出发，探索主导数据、行为模型的一个片段。”

张可道。

“大家可以通过课题，去找到每个人对大数据的新理解。”

“硬件层面的准备基本完善，但软件层面的部署还得我们亲自来，首先是分布式文件系统，我们讨论一下，是否直接使用hadoop实现的分布式文件系统：hdfs？”

张可的问题引发了课题实验组每个成员的意见发表。

首先hdfs基本上是个通用的大数据分布式文件系统，最重要的一点是设计就是用来部署在低廉硬件上的。

包括hadoop，完全就是为了大数据而开发的程序。

hadoop框架最核心的设计就两点，hdfs和mapreduce。

hdfs为海量数据提供了存储方式，mapreduce为海量数据提供了计算。

苏小木试图争取了一下，“教授，如果我们课题的时间足够长的话，不如我们试试自己实现，不借用hadoop，重新设计分布式文件系统、并行运算算法、并行处理数据库这些。”

“这样一来，专业针对的就是课题本身的算法、主导数据与行为模型。”

苏小木的话是有道理的，当然也是有私心的……

======

2更。

第322章 有私心的苏小木（2 / 2）