大数据书评的革命

Anonim

阅读有关分析的段落或关注软件即服务挑战的信息图,您会发现“大数据”一词。由于与大数据相关的数字环境,商业模式正在被颠覆。那么什么是利害关系,特别是对于发现与大公司一样有竞争力的数据使用的小企业?

$config[code] not found

作者Viktor Mayer-Schroenberger和Kenneth Cukier已经开始在大数据中回答这个问题:革命将改变我们的生活,工作和思考方式。 Mayer-Schroenberger是牛津大学互联网治理和监管的教授,也是几本书的作者。他最近的是 删除数字时代遗忘的美德 。 Cukier是着名的评论员和数据编辑 经济学家。 两位作者从许多行业,组织和情况的角度出版了大量关于分析主题的着作和文章。

我在Barnes and Noble那里收集了这本大数据书的副本。我想看看作者总结今天的数字数据环境。

以简单的方式添加大数据讨论

Mayer-Schroenberger和Cukier试图简化本书主题背后的背景。实质上, 大数据 是对事物“满足”的观点 - 可以记录为数据的过程,帮助社会理解数据如何增长和被收集。十章以一个单词标题命名,例如Now,Correlation和Messy。这些以及章节中包含的故事旨在阐明数据对社会问题和商业机会的影响。

数据不再只是为了证实或反驳一个假设。相反,组织必须接受数据的混乱 - 即不太关心准确性,而是扩大事件影响事件中的因果关系:

“大数据改变了我们理解和探索世界的方式。在小数据时代,我们受到关于世界如何运作的假设的驱使,然后我们试图通过收集和分析数据来验证。在未来,我们的理解将更多地依赖于丰富的数据而非假设。“

这种“没有更多样本大小”的想法类似于 有线 编辑克里斯安德森关于“理论终结”的断言。实际上,作者确实看到了安德森在宣称从小数据量的假设和建模变得过时时所提出的争论。

其他对数据革命的看法包括对众所周知的主题的一些曲折,例如史蒂夫乔布斯对癌症治疗的选择以及亚马逊对数据的投资以了解客户的购买行为。 Avid技术读者之前可能已经阅读过这些示例,但对于那些粗略熟悉技术事件的人来说,它们可能是新手。有一些有趣的数据应用,例如Con Edison在纽约市防止爆破井盖事件的努力,以及开放数据应用程序FlyOnTime.us。

创造的数据的巨大性肯定允许新的解决方案,但它也带来了新的挑战。乍一看,阅读本书的小企业主可能会觉得他们将承担最大的挑战(阅读亚马逊章节可能不会给当地书店带来温暖和模糊的回忆)。

但Mayer-Schroenberger和Cukier预计中型企业将处于萧条阶段 - 无论是按数据扩展还是保持小规模和灵活性。在这些方面,主题专家在许多行业中的影响力已经降低:

“在媒体上,在赫芬顿邮报,Gawker和Fobres等网站上创建和宣传的内容通常由数据决定,而不仅仅是人类编辑的判断…….当数据显示算法推荐推动更多销售时,Jeff Bezos摆脱了亚马逊的内部书评。这意味着在工作场所取得成功所需的技能正在发生变化。“

小企业读者可能不会觉得这些材料将可操作的想法与他们的环境联系起来。本书为大数据主题提供了一个简短的历史背景,其中的注释表明过去10年左右的参考文献。但是,没有关于数据库的IT级别讨论,也没有关于规划管理的讨论 - 至少与技术特性有关。期待noSQL与SQL辩论的读者应该寻找其他地方。

$config[code] not found

本书给小企业主最具思想挑战性的观点是对技术效用如何演变的警示。这不同于任何关于技术可行性的古老争论,这种争论可能会妨碍预算考虑。企业战略家不应关注电子邮件是否优于社交媒体,而应更加关注其营销趋势,以便在营销媒介和客户响应之间建立有用的关联。

这就是这种思维过程 大数据 鼓励。因此,本书的最终价值在于讲述组织如何接受数据和建模解决方案以改善运营的故事。

风险与控制的章节将概念用于进一步的现实场景。这些章节涵盖了最新观点的隐私主题,并且可能是辨别如何处理技术的最具可操作性的。 Mayer-Schroenberger和Cukier概述了分析的定义与选择合适的客户行为预测因子。但他们采取了正确的步骤来概述社会并发症,例如“基于倾向的惩罚”,他们称之为“恶心”。作者还注意到算法主义者的兴起 - 具有数学,科学和计算机科学背景的专业人士帮助确保问责制对于我们创建的系统:

“我们设想算法主义者为这些问题提供一种以市场为导向的方法,这可能会阻碍更具侵入性的监管形式……为了确保人们在技术推广的同时得到保护,我们不能让大数据超出人类塑造技术的能力范围。“

作者在他们的写作中传达了一种充满希望的基调,以及大数据研究未来可能产生的实用主义基调。

但对于今天的商业环境,阅读 大数据 将帮助创新的小企业以不同的方式思考人类行为的原因以及如何记录这种行为。可以更好地考虑改善服务或释放新服务。还有其他书籍更深入地讨论了样本量和相关性,但作为商业入门, 大数据 努力使一个被误解的话题更容易理解。

$config[code] not found 6评论▼