-
BI cube的前世今生:商业智能BI为什么需要cube技术
所属栏目:[大数据] 日期:2021-03-16 热度:70
企业中常常会出现这样一幕幕尴尬的场景: 企业的决策人员需要从不同的角度来审视业务,协助他们分析业务,例如分析销售数据,可能会综合时间周期、产品类别、地理分布、客户群类等多种因素来考量。 IT 人员在每一个分析角度上都建了一张报表。然而,决策人员[详细]
-
一共81个,开源大数据处理工具汇总(上)
所属栏目:[大数据] 日期:2021-03-16 热度:107
作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。 本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一[详细]
-
大数据处理的一些总结和应用(有关舆情监控)
所属栏目:[大数据] 日期:2021-03-16 热度:124
? ? 说到大数据处理可能大家都不会陌生,这是近年来非常火热的话题,各行各业都想借助大数据为自己助力,有了这个工具,就好像在飞机上看农田一般清晰,一目了然,也也就是业内人士常说的大数据提供了一个------上帝视角 大数据的概念: 1、指的是所涉及的资[详细]
-
[BZOJ3110][Zjoi2013]K大数查询(主席数套线段树 )
所属栏目:[大数据] 日期:2021-03-16 热度:130
题目描述 传送门 题解 外层权值线段树,权值线段树的每一个位置都是一棵线段树,线段树用动态开点。 注意pushdown或者查询的时候还有可能要继续开点。 注意最顶端的点的权有可能是炸了int了,因为有可能加入了50000^2个点。 代码 #includealgorithm#includei[详细]
-
余弦相似性:找出相似文章
所属栏目:[大数据] 日期:2021-03-16 热度:178
上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cos[详细]
-
bzoj 3110: [Zjoi2013]K大数查询(树套树,整体二分)
所属栏目:[大数据] 日期:2021-03-16 热度:122
3110: [Zjoi2013]K大数查询 Time Limit:? 20 Sec?? Memory Limit:? 512 MB Submit:? 4020?? Solved:? 1547 [ Submit][ Status][ Discuss] Description 有N个位置,M个操作。操作有两种,每次操作如果是1 a b c的形式表示在第a个位置到第b个位置,每个位置加[详细]
-
数据流和批量大数据分析技术 Apache Apex 提升为 Apache 顶级项
所属栏目:[大数据] 日期:2021-03-16 热度:108
数据流和批量大数据分析技术Apache Apex近日被Apache软件基金会提升为顶级项目。这项技术已被包括第一资本(Capital One)和通用电气(GE)在内的企业组织使用,可以帮助开发人员更快速地创建充分利用实时数据的应用程序。 Apache Spark日益受到关注,表明了[详细]
-
大数加法运算
所属栏目:[大数据] 日期:2021-03-16 热度:174
void add(char a[],char b[]){/*********************装换*********************/int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[i] = 0;}int lena = strlen(a);int lenb = strlen(b);for (int i = lena - 1,j = 0; i = 0; i--)[详细]
-
图像相似性搜索的原理
所属栏目:[大数据] 日期:2021-03-16 热度:151
本文转自: http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html http://www.voidcn.com/article/p-nvcdxgfv-bnx.html http://blog.sina.com.cn/s/blog_b27f71160101gp9c.html http://www.voidcn.com/article/p-ojqegjmq-wy.html[详细]
-
大数加,减,乘,取余一起
所属栏目:[大数据] 日期:2021-03-16 热度:98
#includeiostream#includestring#define LEN 100using namespace std;void add(char a[],char b[]){/*********************装换*********************/int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[i] = 0;}int lena = strlen[详细]
-
最值得推荐的统计和数据分析好书之一
所属栏目:[大数据] 日期:2021-03-11 热度:128
推荐一本统计和数据分析领域非常受欢迎的书,这书升级版原版评价甚至比第1版更好,中文版最近刚出版。 后面的图中给出了豆瓣和知乎对第一版的评价,还有知乎受关注的相关问题的网址。 《R语言实战(第2版)》 R in Action ,Second Edition: Data analysis an[详细]
-
大数加法、减法和乘法
所属栏目:[大数据] 日期:2021-03-11 热度:51
加法: #includestdio.h#includestring.h#includestdlib.hchar* add(const char *arr,const char *brr){ int lena=strlen(arr); int lenb=strlen(brr); int maxlen=(lenalenb)?lenb:lena; char* sum=(char*)malloc(maxlen+2); memset(sum,'0',maxlen+1); sum[详细]
-
当我们谈大数据分析的时候,我们在谈什么?
所属栏目:[大数据] 日期:2021-03-11 热度:121
数据分析是一个大话题,借这篇笔记整理一下自己的思路:数据分析是什么?涉及到哪些技术?有哪些数据公司玩家?如何定位数据分析的价值?如果选择数据分析作为自己的职业,需要掌握什么样的基本概念?希望帮助对于数据分析有兴趣的同学快速入门! 前言 数据[详细]
-
【快讯】R语言在大数据统计分析中的应用及前景
所属栏目:[大数据] 日期:2021-03-11 热度:52
2016年6月8日下午,数据观—清华大数据 “ 技术 · 前沿 ” 系列思享会在清数D-LAB顺利举办。本次活动有幸邀请到美国普度大学统计系教授及清华大学统计学研究中心兼职教授朱宇进行R语言在大数据统计分析中的应用及前景主题分享。 本次讲座分别介绍了统计分析[详细]
-
精准测试新玩法の基于犯罪心理学挖掘代码风险
所属栏目:[大数据] 日期:2021-03-11 热度:53
前言 ? 犯罪心理学还能用于挖掘代码风险? 挖掘出来的东西是什么? 挖掘出来的东东长什么样子 ? 挖掘出来能用来做什么? 具体怎么样挖掘呢 ? 这是本文的主要探讨的内容. ? 在大型的项目中 , 代码和模块的复杂度在很大程度上决定了测试任务的时间 ,? 在项目[详细]
-
常用的数据标准化方法
所属栏目:[大数据] 日期:2021-03-11 热度:68
数据的标准化(normalization)是将数据按照一定规则缩放,使之落入一个小的特定区间。这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z标准化,当然,也有一些其他的标准化方[详细]
-
BI Intelligence 报告:2016 年 5 大数字化趋势(附下载)
所属栏目:[大数据] 日期:2021-03-11 热度:118
C 新智元编译?? ? 来 源:Business Insider 译者:闻菲 【新智元导读】 Business Insider 网站日前公开了旗下调研团队 BI Intelligence 去年 2 月发布的调查报告,成功 预测了消息APP成为新的OS和Bot的崛起。报告还预计物联网是下一场工业革命,将颠覆能源、[详细]
-
HDU 1212 Big Number(大数取模)
所属栏目:[大数据] 日期:2021-03-11 热度:86
Big Number Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 7063????Accepted Submission(s): 4866 Problem Description As we know,Big Number is always troublesome. But it's really impor[详细]
-
R语言:SMOTE - Supersampling Rare Events in R:用R对非平衡数
所属栏目:[大数据] 日期:2021-03-11 热度:52
SMOTE - Supersampling Rare Events in R:用R对稀有事件进行超级采样 在这个例子中将用到以下三个包 {DMwR} - Functions and data for the book “Data Mining with R” and SMOTE algorithm:SMOTE算法 {caret} - modeling wrapper,functions,commands:模型[详细]
-
寻找第K大数的方法
所属栏目:[大数据] 日期:2021-03-11 热度:99
寻找一堆数中第K大的数,第一感觉是排序,然后将排序之后的值取第K个。但是实际上,这种方式最少的时间复杂度是O(nlogn)。有更简单的方式可以实现线性的时间复杂度。 算法总是有穷尽的,而思想无穷尽,而实用算法的本质是用空间去换取时间。 这里的方案是:[详细]
-
《hadoop进阶》PeopleRank从社交关系中挖掘价值用户
所属栏目:[大数据] 日期:2021-03-10 热度:177
转载请注明出处: 转载自? Thinkgamer的CSDN博客: blog.csdn.net/gamer_gyt 代码下载地址:点击查看 1:PageRank 与 PeopleRank 2:需求分析:挖掘CSDN博客的价值用户 3:算法模型:PeopleRank算法 4:架构设计:从数据准备到PR算法的MR化 5:程序开发:had[详细]
-
XTU 1247 Robb#39;s Problem
所属栏目:[大数据] 日期:2021-03-10 热度:178
Robb’s Problem [ Submit Code ] [ Top 20 Runs ] Acceteped : 48 ? Submit : 335 Time Limit : 1000 MS ? Memory Limit : 65536 KB ? Description Robb’s Problem 题目描述 Robb想知道阶乘 n ! 第 m 位数码是什么? 输入 第一行是一个整数 T , ( 1 ≤ T[详细]
-
基因数据处理38之dbSnpId到omimId的映射表
所属栏目:[大数据] 日期:2021-03-10 热度:129
1.下载: 首先收到【2】,来源是【2】 【1】中有描述: You can also get those SNPs with an OMIM ID number by downloading from the dbSNP FTP site: the OmimVarLocusIdSNP table contains the information you need for your organisim of interest (hu[详细]
-
基因数据处理39之mango安装记录
所属栏目:[大数据] 日期:2021-03-10 热度:102
更多代码请见:https://github.com/xubo245/AdamLearning 1解释 mango安装记录 mango主要是在adam上实现 可视化平台 A scalable genome browser 2.代码: git clone https: //github.com/bigdatagenomics/mango.git cd mangomvn clean package -DskipTests[详细]
-
基因数据处理41之mango使用失败
所属栏目:[大数据] 日期:2021-03-10 热度:150
hadoop@Master:~/xubo/tools/adam- 2.10 - 0.19 -git/bin$ mango-submit /xubo/mango/snap/datatest .fa .adam -read_files /xubo/mango/snap/datatest2 .sort .bam .adam -var_files /xubo/mango/snap/datatest2 .flt .vcf .adam -feat_file /xubo/mango/sn[详细]
