设为首页
收藏本站
开启辅助访问
切换到宽版
请
登录
后使用快捷导航
没有帐号?
立即注册
用户名
Email
自动登录
找回密码
密码
登录
立即注册
快捷导航
首页
Portal
互动
BBS
群组
Group
交友
排行榜
搜索
搜索
热搜:
AWS
Hadoop
Tableau
本版
帖子
群组
用户
大数据
»
互动
›
数据挖掘
›
R语言
›
SparkR开发模式探讨
返回列表
查看:
32557
|
回复:
1
SparkR开发模式探讨
[复制链接]
Zeng
Zeng
当前离线
积分
287
15
主题
15
帖子
287
积分
版主
积分
287
收听TA
发消息
电梯直达
楼主
发表于 2015-10-22 10:45:23
|
只看该作者
|
倒序浏览
|
阅读模式
最近项目需要在SparkR中部署生产系统,遇到一些问题,SparkR重载了一些R的方法,需要引起注意。
我们使用SparkR的模式是:
1、先利用SparkR进行预处理,从大数据集中抽取聚合数据,数据格式为DataFrame;
2、然后collect到本地R中进行分析,数据格式为data.frame。
SparkR提供了一些新的接口,参考文档有:
1、Quick Start:
http://spark.apache.org/docs/latest/sparkr.html
2、API:
http://spark.apache.org/docs/latest/api/R/index.html
3、DataFrame Guide:
http://spark.apache.org/docs/latest/sql-programming-guide.html
4、Tutorial:
https://www.codementor.io/spark/ ... rame-operations-sql
5、SparkR函数:
http://blog.csdn.net/wa2003/article/details/46777237
收藏
0
转播
回复
使用道具
举报
yingqu
yingqu
当前离线
积分
28
0
主题
1
帖子
28
积分
新手上路
新手上路, 积分 28, 距离下一级还需 22 积分
新手上路, 积分 28, 距离下一级还需 22 积分
积分
28
收听TA
发消息
沙发
发表于 2015-10-22 10:52:41
|
只看该作者
好东东,顶起
回复
支持
反对
使用道具
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
浏览过的版块
技术资讯
Pentaho
实时数据处理方案
Hive
Copyright © 2015
bigbase.cn
(http://www.bigbase.cn/) 版权所有 All Rights Reserved.
Powered by
Discuz!
X3.2 技术支持:
克米设计
京ICP备12000707号-3
快速回复
返回顶部
返回列表