blog.icocoro
azkaban
wechat-markdown
antv
programcreek
my.vultr.com

找到约105条结果

HDFS与Hive迁移 | 知了小巷

2018-05-08

HDFS与Hive迁移 | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 HDFS与Hive迁移 发表于 2018-05-08 | 分类于 大数据迁移 | | 本文总阅读量 次 source hadoop 2.7.5 target hadoop 2.6.5 hadoop distcp DistCp Version2 Guide 大型集群间拷贝 DistCp Version 2 (distributed copy) is a tool used for large inter/intra-cluster copying. 分布式MapReduce和容错 It

pyspark-streaming实战 | 知了小巷

2018-05-07

pyspark-streaming实战 | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 pyspark-streaming实战 发表于 2018-05-07 | 分类于 spark | | 本文总阅读量 次 版本 Spark2.3.0[Using Scala version 2.11.8, Java HotSpot(TM) 64-Bit Server VM, 1.8.0_40] Python 3.5.1 Flume 1.8.0 Kafka kafka_2.11-0.9.0.1 8个小类 socket_wordcount stateful_wordcount

打通实时流处理log4j-flume-kafka-structured-streaming | 知了小巷

2018-05-07

打通实时流处理log4j-flume-kafka-structured-streaming | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 打通实时流处理log4j-flume-kafka-structured-streaming 发表于 2018-05-07 | 分类于 实时流处理 | | 本文总阅读量 次 模拟产生log4j日志 jar包依赖 pom.xml 1 2 3 4 5 6 7 8 9 10 11 12 13 log4j log4j

2018-05-03

flume实时采集数据到kafka | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 flume实时采集数据到kafka 发表于 2018-05-03 | 分类于 数据采集 | | 本文总阅读量 次 启动zookeeper和kafka broker server 1 2 3 4 5 6 7 8 $ zkServer.sh start JMX enabled by default Using config: /usr/local/zookeeper-3.4.6/bin/../conf/zoo.cfg Starting zookeeper ... STARTED

flume实战案例 | 知了小巷

2018-04-23

flume实战案例 | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 flume实战案例 发表于 2018-04-23 | 分类于 数据采集 | | 本文总阅读量 次 flume下载安装 Apache Flume is a distributed, reliable, and available system for efficiently collecting, aggregating and moving large amounts of log data from many different sources to a centralized data

集群监控工具Ganglia的使用 | 知了小巷

2018-04-10

集群监控工具Ganglia的使用 | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 集群监控工具Ganglia的使用 发表于 2018-04-10 | 分类于 监控 | | 本文总阅读量 次 Ganglia Ganglia is a scalable, distributed monitoring tool for high-performance computing systems, clusters and networks. The software is used to view either live or recorded statistics

pyspark访问Elasticsearch数据 | 知了小巷

2018-03-07

pyspark访问Elasticsearch数据 | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 pyspark访问Elasticsearch数据 发表于 2018-03-07 | 分类于 大数据 | | 本文总阅读量 次 文档资料 https://www.elastic.co/guide/en/elasticsearch/hadoop/current/spark.html https://stackoverflow.com/questions/42114519/inserting-arrays-in-elasticsearch-via-pyspark 测试

pyspark通过mongo-hadoop-spark访问MongoDB数据 | 知了小巷

2018-02-26

pyspark通过mongo-hadoop-spark访问MongoDB数据 | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 pyspark通过mongo-hadoop-spark访问MongoDB数据 发表于 2018-02-26 | 分类于 大数据 | | 本文总阅读量 次 mongo-hadoop-spark-1.5.2.jar pymongo-spark pymongo wget http://central.maven.org/maven2/org/mongodb/mongo-hadoop/mongo-hadoop-spark/1.5.2/mongo

pyspark通过mongo-spark-connector访问MongoDB数据 | 知了小巷

2018-02-26

pyspark通过mongo-spark-connector访问MongoDB数据 | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 pyspark通过mongo-spark-connector访问MongoDB数据 发表于 2018-02-26 | 分类于 大数据 | | 本文总阅读量 次 文档资料 https://docs.mongodb.com/spark-connector/v1.1/python-api/ mongo-spark-connector仓库地址 http://maven-repository.com/artifact/org.mongodb

使用DataX在MySQL之间同步数据 | 知了小巷

2018-02-08

使用DataX在MySQL之间同步数据 | 知了小巷 知了小巷 首页 时光轴 标签 热点 读书 视觉 关于 公益 搜索 使用DataX在MySQL之间同步数据 发表于 2018-02-08 | 分类于 大数据 | | 本文总阅读量 次 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。 1. DataX git https://github.com/alibaba/DataX.git 可以开发自己的reader或writer插件,也可以对已经存在的进行

京东金融

udemy

飞科 FH6807 陶瓷板直发 烫发器 美发 夹发板

狼人杀 Q版 铁盒装 错综迷离的事件让游戏变幻莫测

2017 秋冬新款中年男装 七折抗起球 半高领时尚百搭内搭长袖针织衫


SpringBoot1.4.2+thymeleaf1.5.6+lucene5.5.2+mmseg4j2.3.0+BootStrapv4.0.0-alpha.6 申请友链-给我发邮件

© 粤ICP备15079982号-2