当前位置: 首页 > news >正文

营销型网站建设定制口碑营销案例

营销型网站建设定制,口碑营销案例,wordpress主题制作插件,软件推广赚钱一个30spark的算子 1.spark的单Value算子 Spark中的单Value算子是指对一个RDD中的每个元素进行操作#xff0c;并返回一个新的RDD。下面详细介绍一些常用的单Value算子及其功能#xff1a; map#xff1a;逐条映射#xff0c;将RDD中的每个元素通过指定的函数转换成另一个值并返回一个新的RDD。下面详细介绍一些常用的单Value算子及其功能 map逐条映射将RDD中的每个元素通过指定的函数转换成另一个值最终返回一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.map(lambda x: x * 2) # result: [2, 4, 6, 8, 10]flatMap: 扁平化映射将RDD中的每个元素通过指定的函数转换成多个值并将这些值展开为一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.flatMap(lambda x: range(x, x3)) # result: [1, 2, 3, 2, 3, 4, 3, 4, 5, 4, 5, 6, 5, 6, 7]glom将一个分区中的多个单条数据转换为相同类型的单个数组进行处理。返回一个新的RDD其中每个元素是一个数组。 rdd sc.parallelize([1, 2, 3, 4, 5], 2) # 两个分区 result rdd.glom().collect() # result: [[1, 2], [3, 4, 5]]groupBy: 将RDD中的元素按照指定条件分组返回一个键值对RDD其中的每个元素是一个(key, iterator)对key为分组的条件iterator为对应分组的元素迭代器。 rdd sc.parallelize([apple, banana, cherry, date]) result rdd.groupBy(lambda x: x[0]) # result: [(a, [apple]), (b, [banana]), (c, [cherry]), (d, [date])]filter根据指定的规则过滤出符合条件的元素返回一个新的RDD。 rdd sc.parallelize([1, 2, 3, 4, 5]) result rdd.filter(lambda x: x % 2 0) # result: [2, 4]sample从RDD中进行采样返回一个包含采样结果的新的RDD。 rdd sc.parallelize(range(10)) result rdd.sample(False, 0.5) # result: [0, 2, 3, 4, 5, 7]distinctshuffle去重将RDD中重复的元素去除返回一个由不重复元素组成的新的RDD。 rdd sc.parallelize([1, 2, 2, 3, 3, 3]) result rdd.distinct() # result: [1, 2, 3]coalesceshuffle缩减分区将RDD的分区数缩减为指定的数量。 rdd sc.parallelize([1, 2, 3, 4, 5], 4) # 4个分区 result rdd.coalesce(2) # result: [1, 2, 3, 4, 5]分区数变为2repartitionshuffle扩增分区数底层是coalesce。将RDD的分区数扩增到指定的数量。 rdd sc.parallelize([1, 2, 3, 4, 5], 2) # 2个分区 result rdd.repartition(4) # result: [1, 2], [3, 4], [5]分区数变为4sortByshuffle根据指定的规则对数据源中的数据进行排序默认为升序。 rdd sc.parallelize([3, 1, 4, 2, 5]) result rdd.sortBy(lambda x: x) # result: [1, 2, 3, 4, 5]这些单Value算子能够对RDD中的每个元素进行处理并返回一个新的RDD可以用于各种数据转换、过滤、去重等操作。 2. Spark的双Value算子 双Value算子是指对两个RDD进行操作并返回一个新的RDD。下面介绍一些常用的双Value算子及其功能 union: 对两个RDD求并集返回包含两个RDD中所有元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.union(rdd2) # result: [1, 2, 3, 3, 4, 5]intersection: 对两个RDD求交集返回包含两个RDD中共有元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.intersection(rdd2) # result: [3]subtract: 对两个RDD求差集返回只属于第一个RDD而不属于第二个RDD的元素的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([3, 4, 5]) result rdd1.subtract(rdd2) # result: [1, 2]cartesian: 对两个RDD进行笛卡尔积操作返回所有可能的元素对组成的新RDD。 rdd1 sc.parallelize([1, 2]) rdd2 sc.parallelize([a, b]) result rdd1.cartesian(rdd2) # result: [(1, a), (1, b), (2, a), (2, b)]zip: 将两个RDD的元素按照索引位置进行配对返回键值对组成的新RDD。 rdd1 sc.parallelize([1, 2, 3]) rdd2 sc.parallelize([a, b, c]) result rdd1.zip(rdd2) # result: [(1, a), (2, b), (3, c)]join: 对两个键值对RDD进行内连接操作返回具有相同键的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (2, yellow)]) result rdd1.join(rdd2) # result: [(1, (apple, red)), (2, (banana, yellow))]leftOuterJoin: 对两个键值对RDD进行左外连接操作返回左侧RDD中所有元素以及与之匹配的右侧RDD中的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (3, yellow)]) result rdd1.leftOuterJoin(rdd2) # result: [(1, (apple, red)), (2, (banana, None))]rightOuterJoin: 对两个键值对RDD进行右外连接操作返回右侧RDD中所有元素以及与之匹配的左侧RDD中的元素对组成的新RDD。 rdd1 sc.parallelize([(1, apple), (2, banana)]) rdd2 sc.parallelize([(1, red), (3, yellow)]) result rdd1.rightOuterJoin(rdd2) # result: [(1, (apple, red)), (3, (None, yellow))]这些双Value算子能够对两个RDD进行操作并返回一个新的RDD可以用于求并集、交集、差集等操作也可以进行连接操作根据键值对进行配对。 3. Spark的Key-Value算子 Key-Value算子是指对键值对RDD进行操作的算子这些算子主要用于处理具有键值对结构的数据其中键位于第一列值位于第二列。下面介绍一些常用的Key-Value算子及其功能 reduceByKey: 对具有相同键的元素进行聚合操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.reduceByKey(lambda x, y: x y) # result: [(1, 5), (2, 9)]groupByKey: 对具有相同键的元素进行分组操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.groupByKey() # result: [(1, pyspark.resultiterable.ResultIterable object at 0x7f3128a3e370), (2, pyspark.resultiterable.ResultIterable object at 0x7f3128a3e3d0)]sortByKey: 按照键的顺序对RDD进行排序操作默认升序排列。 rdd sc.parallelize([(3, apple), (1, banana), (2, orange)]) result rdd.sortByKey() # result: [(1, banana), (2, orange), (3, apple)]mapValues: 对键值对RDD中的值进行操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.mapValues(lambda x: fruit x) # result: [(1, fruit apple), (2, fruit banana)]flatMapValues: 对键值对RDD中的值进行扁平化操作返回一个新的键值对RDD。 rdd sc.parallelize([(1, hello world), (2, goodbye)]) result rdd.flatMapValues(lambda x: x.split()) # result: [(1, hello), (1, world), (2, goodbye)]keys: 返回所有键组成的一个新的RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.keys() # result: [1, 2]values: 返回所有值组成的一个新的RDD。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.values() # result: [apple, banana]除了上述提到的常用Key-Value算子还有一些其他常见的Key-Value算子它们在处理键值对RDD时也非常有用。以下是其中几个 countByKey: 统计每个键出现的次数返回一个字典。 rdd sc.parallelize([(1, apple), (1, banana), (2, orange), (2, banana)]) result rdd.countByKey() # result: {1: 2, 2: 2}collectAsMap: 将键值对RDD转换为字典形式。 rdd sc.parallelize([(1, apple), (2, banana)]) result rdd.collectAsMap() # result: {1: apple, 2: banana}lookup: 查找具有给定键的所有值并返回一个列表。 rdd sc.parallelize([(1, apple), (2, banana), (1, orange)]) result rdd.lookup(1) # result: [apple, orange]foldByKey: 对具有相同键的元素进行折叠操作类似于reduceByKey但可以指定初始值。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.foldByKey(0, lambda x, y: x y) # result: [(1, 5), (2, 9)]aggregateByKey: 对具有相同键的元素进行聚合操作可以指定初始值和两个函数一个用于局部聚合另一个用于全局聚合。 rdd sc.parallelize([(1, 2), (1, 3), (2, 4), (2, 5)]) result rdd.aggregateByKey(0, lambda x, y: x y, lambda x, y: x y) # result: [(1, 5), (2, 9)]这些Key-Value算子能够对键值对RDD进行操作实现聚合、分组、排序、映射等功能。使用这些算子可以更方便地处理具有键值对结构的数据。
http://www.lebaoying.cn/news/112090.html

相关文章:

  • wordpress采集软件杭州谷歌seo公司
  • 宁波网站建设高端做网站的收获及感想
  • 网站建设和数据库维护wordpress如何让导航居中
  • 宁波好的网站推广软件wordpress如何用API采集
  • 怎么把自己电脑建设网站wordpress插件合并
  • 常见的网站开发软件有哪些电子行业网站建设
  • 做招聘网站经营范围惠州seo博客报价
  • 网站建设的重要性意义与价值变更网站怎么做
  • 中国响应式网站建设长沙市网站制作公司
  • wordpress 基础seo建站2345浏览器下载
  • 邵东网站wordpress主题 响应式
  • 深圳网站的优化公司哪家好营销型网站开发
  • 选择一个网站进行优化logo参考网站
  • 潜江网站设计公司wordpress用户后台权限
  • 内部网站建设教程游戏网站网页设计
  • 免费的查企业的网站万网注册域名做简单网站
  • 社保网站哪里做转入购买网站模板
  • 杭州网站建设长春公司专门做问卷调查的一个网站
  • 网站建设7个基本流程分析毕业设计做网站用php好吗
  • 遵义公司网站搭建多少钱新网站如何做百度关键词
  • 小型网站有哪些什么是搜索引擎销售
  • 福建省建设人才与科技发展中心网站wordpress做app
  • ui是网站建设吗可以做软件的软件
  • 龙之向导外贸经理人网站wordpress的配置文件在什么位置
  • 网站数据库如何备份最近最新资源在线观看
  • 苏州市建设职业培训中心网站wordpress 广告收入
  • 用word怎么做首页网站wordpress重置后导航没反应
  • 网站建设不用备案的深圳企业贷款
  • 1688的网站特色网站设计网页主页介绍
  • 如何解析网站国外做兼职的网站有哪些