博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
开源大数据周刊-第22期
阅读量:6577 次
发布时间:2019-06-24

本文共 715 字,大约阅读时间需要 2 分钟。

摘要:
本周关注:大数据部门、数据科学家、机器学习发展与机遇、spark2.0 Structured Streaming、Hbase运维、Sqoop、Flink的第一本书籍。

阿里云E-Mapreduce动态

1.5.0版本(正在研发)

  • 增加集群整体运行情况的仪表盘
  • 访问OSS不需要写id、key,增强安全性
  • 集群其中后,可以重启、修改配置及安装软件

1.6.0版本

  • 交互式查询(支持hive、spark)

资讯

  • 在大数据时代,每家公司都要有自己的大数据部门吗? 结论也不能下的太武断。如果这个问题换做是:在电气时代,每家公司都要有个发电厂吗?是不是会更好回答一些
  • 人工智能的蜂巢很大的原因就是背后深度学习技术,尤其是计算机视觉方面叹为观止的成绩,才会带来这么多人谈论人工智能。赵巍表示,过度炒作深度学习也是一个错误,深度学习只是人工智能技术中比较有成绩的工作,人工智能的核心驱动力应该是机器学习技术
  • 什么是数据科学呢?本文围绕数据科学家这个词做出详细的探讨。
  • Spark 2.0 将流式计算也统一到DataFrame里去了,提出了Structured Streaming的概念,将数据源映射为一张无线长度的表,同时将流式计算的结果映射为另外一张表,完全以结构化的方式去操作流式数据,复用了其对象的Catalyst引擎。
  • Hbase运维的一些实践
  • 数据流通是数据分析的前提,Sqoop是目前很多企业的标配。
  • 业界flink第一本书

国内大数据相关会议

| 会议 | 地点 | 时间 | 费用 |

| --- | --- | --- | --- |
| [2016杭州云栖大会] | 杭州 | 2016年10月 | 收费+免费 |

转载地址:http://xqwno.baihongyu.com/

你可能感兴趣的文章
eclipse各版本代号
查看>>
mysql 配置 utf8 依然乱码
查看>>
089实战 Nginx的安装
查看>>
Laravel 使用多个数据库的问题。
查看>>
overridePendingTransition简介
查看>>
7 -- Spring的基本用法 -- 5... Spring容器中的Bean;容器中Bean的作用域;配置依赖;...
查看>>
Ubuntu开机自启动
查看>>
iOS程序启动原理
查看>>
HTTP协议 - 协议格式
查看>>
PHP实反向代理-收藏
查看>>
Codeforces Round #394 (Div. 2) A. Dasha and Stairs 水题
查看>>
Javascript模块化编程(二):AMD规范
查看>>
【规范】前端编码规范——注释规范
查看>>
java内存溢出怎么解决
查看>>
mysql中游标的使用案例详解(学习笔记)(转)
查看>>
第一百四十八节,封装库--JavaScript,菜单切换
查看>>
自定义checkbox/radio
查看>>
LogStash如何通过jdbc 从mysql导入elasticsearch
查看>>
Java数据结构之LinkedList、ArrayList的效率分析
查看>>
VS Code搭建.NetCore开发环境(二)
查看>>