当前位置:K88软件开发 → 文章中心 → 大数据 → Apache Pig → 文章列表
文章标题关闭所有内容预览 | 展开所有内容预览
-
Apache Pig 讨论
[内容预览]
0 | 2019-01-26 10:04:02
由jarodhu创建,youj最后一次修改2016-12-28ApachePig是MapReduce的一个抽象。它是一个工具/平台,用于分析较大的数据集,将它们表示为数据流。Pig通常与Hadoop一起使用;我们可以使用Pig在Hadoop中执行所有的数据操作操作。
[阅读全文]
-
Apache Pig 有用资源
[内容预览]
0 | 2019-01-26 10:04:01
由jarodhu创建,youj最后一次修改2016-12-28以下资源包含有关ApachePig的其他信息。请使用它们获得有关此主题的更深入的知识。ApachePig上的有用链接ApachePig-ApachePig的参考。PigWiki-维基百科参考资料。有用的ApachePig书籍
[阅读全文]
-
Apache Pig 运行脚本
[内容预览]
0 | 2019-01-26 10:04:00
由jarodhu创建,youj最后一次修改2016-12-28在本章中,我们将了解如何以批处理模式运行ApachePig脚本。Pig脚本中的注释在将脚本写入文件时,我们可以在其中包含注释,如下所示。多行注释我们将用'/*'开始多行注释,以'*/'结束。/*Thesearethemulti-linecommentsInt...
[阅读全文]
-
Apache Pig 用户定义函数(UDF)
[内容预览]
0 | 2019-01-26 10:03:59
由jarodhu创建,youj最后一次修改2016-12-28除了内置函数之外,ApachePig还为UserDefinedFunction(UDF:用户定义函数)提供广泛的支持。使用这些UDF,可以定义我们自己的函数并使用它们。UDF支持六种编程语言,即Java,Jython,Python,JavaScript,Ru...
[阅读全文]
-
Apache Pig 数学函数
[内容预览]
0 | 2019-01-26 10:03:58
由jarodhu创建,youj最后一次修改2016-12-28我们在ApachePig中有以下Math(数学)函数:S.N.函数&描述1ABS(expression)获取表达式的绝对值。2ACOS(expression)获得表达式的反余弦值。3ASIN(expression)获取表达式的反正弦值。4ATAN(expre...
[阅读全文]
-
Apache Pig 日期时间函数
[内容预览]
0 | 2019-01-26 10:03:57
由jarodhu创建,youj最后一次修改2016-12-28ApachePig提供以下日期和时间函数-S.N.函数&描述1ToDate(milliseconds)此函数根据给定的参数返回日期时间对象。此函数的另一个替代方法是ToDate(iosstring),ToDate(userstring,format),ToD...
[阅读全文]
-
Apache Pig 字符串函数
[内容预览]
0 | 2019-01-26 10:03:55
由jarodhu创建,youj最后一次修改2016-12-28在ApachePig中有以下String函数。S.N.函数&描述1ENDSWITH(string,testAgainst)验证给定字符串是否以特定子字符串结尾。2STARTSWITH(string,substring)接受两个字符串参数,并验证第一个字符串是...
[阅读全文]
-
Apache Pig 包和元组函数
[内容预览]
0 | 2019-01-26 10:03:54
由jarodhu创建,youj最后一次修改2016-12-28下面给出了Bag和Tuple函数的列表。S.N.函数&描述1TOBAG()将两个或多个表达式转换为包。2TOP()获取关系的顶部N个元组。3TOTUPLE()将一个或多个表达式转换为元组。4TOMAP()将key-value对转换为Map。
[阅读全文]
-
Apache Pig 加载和存储函数
[内容预览]
0 | 2019-01-26 10:03:53
由jarodhu创建,youj最后一次修改2016-12-28ApachePig中的加载和存储函数用于确定数据如何从Pig中弹出。这些函数与加载和存储运算符一起使用。下面给出了Pig中可用的加载和存储函数的列表。S.N.函数&描述1PigStorage()加载和存储结构化文件。2TextLoader()将非结构...
[阅读全文]
-
Apache Pig Eval函数
[内容预览]
0 | 2019-01-26 10:03:52
由jarodhu创建,youj最后一次修改2016-12-28ApachePig提供了各种内置函数,即eval,load,store,math,string,bag和tuple函数。Eval函数下面给出了ApachePig提供的eval函数列表。S.N.函数&描述1AVG()计算包内数值的平均值。2BagToStrin...
[阅读全文]
-
Apache Pig Limit运算符
[内容预览]
0 | 2019-01-26 10:03:51
由jarodhu创建,youj最后一次修改2016-12-28LIMIT运算符用于从关系中获取有限数量的元组。语法下面给出了LIMIT运算符的语法。grunt>Result=LIMITRelation_namerequirednumberoftuples;例假设在HDFS目录/pig_data/中有一个名为studen...
[阅读全文]
-
Apache Pig Order By运算符
[内容预览]
0 | 2019-01-26 10:03:50
由jarodhu创建,youj最后一次修改2016-12-28ORDERBY运算符用于以基于一个或多个字段的排序顺序显示关系的内容。语法下面给出了ORDERBY运算符的语法。grunt>Relation_name2=ORDERRelatin_name1BY(ASC|DESC);例假设在HDFS目录/pig_data/中...
[阅读全文]
-
Apache Pig Foreach运算符
[内容预览]
0 | 2019-01-26 10:03:49
由jarodhu创建,youj最后一次修改2016-12-28FOREACH运算符用于基于列数据生成指定的数据转换。语法下面给出了FOREACH运算符的语法。grunt>Relation_name2=FOREACHRelatin_name1GENERATE(requireddata);例假设在HDFS目录/pig_da...
[阅读全文]
-
Apache Pig Distinct运算符
[内容预览]
0 | 2019-01-26 10:03:47
由jarodhu创建,youj最后一次修改2016-12-28DISTINCT运算符用于从关系中删除冗余(重复)元组。语法下面给出了DISTINCT运算符的语法。grunt>Relation_name2=DISTINCTRelatin_name1;例假设在HDFS目录/pig_data/中有一个名为student_de...
[阅读全文]
-
Apache Pig Filter运算符
[内容预览]
0 | 2019-01-26 10:03:46
由jarodhu创建,youj最后一次修改2016-12-28FILTER运算符用于根据条件从关系中选择所需的元组。语法下面给出了FILTER运算符的语法。grunt>Relation2_name=FILTERRelation1_nameBY(condition);例假设在HDFS目录/pig_data/中有一个名为s...
[阅读全文]
-
Apache Pig Split运算符
[内容预览]
0 | 2019-01-26 10:03:45
由jarodhu创建,youj最后一次修改2016-12-28SPLIT运算符用于将关系拆分为两个或多个关系。语法下面给出了SPLIT运算符的语法。grunt>SPLITRelation1_nameINTORelation2_nameIF(condition1),Relation2_name(condition2),例...
[阅读全文]
-
Apache Pig Union运算符
[内容预览]
0 | 2019-01-26 10:03:44
由jarodhu创建,youj最后一次修改2016-12-28PigLatin的UNION运算符用于合并两个关系的内容。要对两个关系执行UNION操作,它们的列和域必须相同。语法下面给出了UNION运算符的语法。grunt>Relation_name3=UNIONRelation_name1,Relation_name...
[阅读全文]
-
Apache Pig Cross运算符
[内容预览]
0 | 2019-01-26 10:03:43
由jarodhu创建,youj最后一次修改2016-12-28CROSS运算符计算两个或多个关系的向量积。本章将以示例说明如何在PigLatin中使用cross运算符。语法下面给出了CROSS运算符的语法。grunt>Relation3_name=CROSSRelation1_name,Relation2_name;例...
[阅读全文]
-
Apache Pig Join运算符
[内容预览]
0 | 2019-01-26 10:03:42
由jarodhu创建,youj最后一次修改2016-12-28JOIN运算符用于组合来自两个或多个关系的记录。在执行连接操作时,我们从每个关系中声明一个(或一组)元组作为key。当这些key匹配时,两个特定的元组匹配,否则记录将被丢弃。连接可以是以下类型:Self-joinInner-joinOuter-join?le...
[阅读全文]
-
Apache Pig Cogroup运算符
[内容预览]
0 | 2019-01-26 10:03:40
由jarodhu创建,youj最后一次修改2016-12-28COGROUP运算符的运作方式与GROUP运算符相同。两个运算符之间的唯一区别是group运算符通常用于一个关系,而cogroup运算符用于涉及两个或多个关系的语句。使用Cogroup分组两个关系假设在HDFS目录/pig_data/中有两个文件,即stud...
[阅读全文]
-
Apache Pig Group运算符
[内容预览]
0 | 2019-01-26 10:03:39
由jarodhu创建,youj最后一次修改2016-12-28GROUP运算符用于在一个或多个关系中对数据进行分组,它收集具有相同key的数据。语法下面给出了group运算符的语法。grunt>Group_data=GROUPRelation_nameBYage;例假设在HDFS目录/pig_data/中有一个名为st...
[阅读全文]
-
Apache Pig illustrate运算符
[内容预览]
0 | 2019-01-26 10:03:38
由jarodhu创建,youj最后一次修改2016-12-28illustrate运算符为你提供了一系列语句的逐步执行。语法下面给出了illustrate运算符的语法。grunt>illustrateRelation_name;例假设在HDFS中有一个包含以下内容的文件student_data.txt。001,Raji...
[阅读全文]
-
Apache Pig Explain运算符
[内容预览]
0 | 2019-01-26 10:03:37
由jarodhu创建,youj最后一次修改2016-12-28explain运算符用于显示关系的逻辑,物理和MapReduce执行计划。语法下面给出了explain运算符的语法。grunt>explainRelation_name;例假设在HDFS中有一个包含以下内容的文件student_data.txt。001,Ra...
[阅读全文]
-
Apache Pig Describe运算符
[内容预览]
0 | 2019-01-26 10:03:36
由jarodhu创建,youj最后一次修改2016-12-28describe运算符用于查看关系的模式。语法describe运算符的语法如下grunt>DescribeRelation_name例假设在HDFS中有一个包含以下内容的文件student_data.txt。001,Rajiv,Reddy,984802233...
[阅读全文]
-
Apache Pig Diagnostic运算符
[内容预览]
0 | 2019-01-26 10:03:35
由jarodhu创建,youj最后一次修改2016-12-28Load语句会简单地将数据加载到ApachePig中的指定关系中。要验证Load语句的执行,必须使用Diagnostic运算符。PigLatin提供四种不同类型的诊断运算符:Dump运算符Describe运算符Explanation运算符Illustrati...
[阅读全文]
-
Apache Pig 存储数据
[内容预览]
0 | 2019-01-26 10:03:33
由jarodhu创建,youj最后一次修改2016-12-28在上一章中,我们学习了如何将数据加载到ApachePig中。你可以使用store运算符将加载的数据存储在文件系统中,本章介绍如何使用Store运算符在ApachePig中存储数据。语法下面给出了Store语句的语法。STORERelation_nameINT...
[阅读全文]
-
Apache Pig 加载数据
[内容预览]
0 | 2019-01-26 10:03:32
由jarodhu创建,youj最后一次修改2016-12-28一般来说,ApachePig在Hadoop之上工作。它是一种分析工具,用于分析HadoopFileSystem中存在的大型数据集。要使用ApachePig分析数据,我们必须首先将数据加载到ApachePig中。本章介绍如何从HDFS将数据加载到ApacheP...
[阅读全文]
-
Pig Latin 基础
[内容预览]
0 | 2019-01-26 10:03:31
由jarodhu创建,youj最后一次修改2016-12-28PigLatin是用于使用ApachePig分析Hadoop中数据的语言。在本章中,我们将讨论PigLatin的基础知识,如PigLatin语句,数据类型,通用运算符,关系运算符和PigLatinUDF。PigLatin-数据模型如前面章节所讨论的,Pig的...
[阅读全文]
-
Apache Pig Grunt Shell
[内容预览]
0 | 2019-01-26 10:03:30
由jarodhu创建,youj最后一次修改2016-12-28调用Gruntshell后,可以在shell中运行Pig脚本。除此之外,还有由Gruntshell提供的一些有用的shell和实用程序命令。本章讲解的是Gruntshell提供的shell和实用程序命令。注意:在本章的某些部分中,使用了Load和Store等...
[阅读全文]
-
Apache Pig 执行
[内容预览]
0 | 2019-01-26 10:03:29
由jarodhu创建,youj最后一次修改2016-12-28在上一章中,我们解释了如何安装ApachePig。在本章中,我们将讨论如何执行ApachePig。ApachePig执行模式你可以以两种模式运行ApachePig,即Local(本地)模式和HDFS模式。Local模式在此模式下,所有文件都从本地主机和本地文...
[阅读全文]