
会员
Spark大数据处理与分析
更新时间:2021-03-27 00:16:12 最新章节:参考文献
书籍简介
本书是Spark技术入门的基础类书籍,通过本书的学习实验可以牢固掌握Spark编程技术的基本概念、原理和编程方法,能够进行应用程序的实际开发。
品牌:清华大学
上架时间:2020-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
雷擎编著
同类热门书
最新上架
- 会员《MySQL从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言和丰富多彩的实例,详细介绍了MySQL开发需要掌握的各方面技术。全书共分为4篇22章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,数据表操作,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务,事件,备份与恢计算机14万字
- 会员这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字
- 会员本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现计算机7.1万字
- 会员本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需计算机12万字
- 会员《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。计算机19.6万字
- 会员高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证计算机11.7万字
- 会员数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的计算机21.6万字
同类书籍最近更新
- 会员本书汇集了李国杰院士2008—2017年在《人民日报》《中国科学院院刊》等报刊上发表的文章和重要会议上的报告,反映了作者参与中国工程院、中国科学院和中共中央网络安全和信息化领导小组办公室战略咨询课题的成果。内容包括建设科技强国的路径选择,数字经济的本质特征,云计算、大数据和人工智能等新一代信息技术的发展趋势,发展自主可控基础软硬件的策略,以及关于人才引进与培养的评议等。既有宏观的战略视野和较详细的数据库42.9万字
- 会员本书以MySQL数据库的基础及维护(基础篇)为切入点,重点介绍了MySQL数据库应用系统的性能调优(优化篇),以及高可用可扩展的架构设计(架构篇)。基础篇的主要内容有:MySQL数据库及存储引擎介绍、架构组成、安全管理,以及基本的备份恢复知识。性能篇则从影响MySQL数据库应用系统性能的因素开始进行调优分析,包括Schema设计、Query语句的性能优化、MySQL数据库23.2万字
- 会员本书主要内容围绕2D计算机视觉展开,介绍了相关的基础概念、基本原理、典型算法、实用技术和应用成果。本书可在其姊妹篇《3D计算机视觉:原理、算法及应用》前学习。本书将从客观场景出发到最后提取出目标信息的全过程分为4个部分进行介绍。第1部分是图像采集,介绍了基础的图像采集表达技术;第2部分是图像(预)处理,介绍了一些基本的图像处理技术;第3部分是目标提取,介绍了从图像处理到图像分析的转换技术;第4部分数据库18.1万字
- 会员本书通过一个完整的网上商城,系统讲解如何使用VisualStudio2010(C#)开发基于数据库(SQLServer)的Web应用程序。全书从功能角度描述了商城的商品浏览、挑选商品、购物车、确认订单、注册、登录、查询、报表打印等购物流程,期望读者能掌握:母版页、DataList、GridView、验证控件的使用;QueryString、Session、Cookie、DataTable、数据库4.8万字
- 会员本书为商业银行构建运维体系和掌握核心运维技术提供了指导。以一家中小型的商业银行为蓝本,讲述商业银行运维涉及的技术以及运维体系的搭建。全书一共9章:第1-3章抓哟讲解了商业银行运维在当下面临的挑战,以及传统银行的IT基础架构的前世和今生;第4章详细介绍了商业银行运维的各项主要工作和技术;第5-7章介绍了自动化运维和智能化运维,以及全链路监控;第8-9章介绍了同城双活数据中心以及下一代数据中心的架构。数据库28.6万字