浅析mysql迁移到clickhouse的5种方法-巨人网络通讯

主页 > 知识库 > 浅析mysql迁移到clickhouse的5种方法

浅析mysql迁移到clickhouse的5种方法

数据迁移需要从mysql导入clickhouse, 总结方案如下，包括clickhouse自身支持的三种方式，第三方工具两种。

create table engin mysql
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
 name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
 name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
 ...
 INDEX index_name1 expr1 TYPE type1(...) GRANULARITY value1,
 INDEX index_name2 expr2 TYPE type2(...) GRANULARITY value2
) ENGINE = MySQL('host:port', 'database', 'table', 'user', 'password'[, replace_query, 'on_duplicate_clause']);

官方文档: https://clickhouse.yandex/docs/en/operations/table_engines/mysql/

注意，实际数据存储在远端mysql数据库中，可以理解成外表。

可以通过在mysql增删数据进行验证。

insert into select from
-- 先建表
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
 name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
 name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
 ...
) ENGINE = engine
-- 导入数据
INSERT INTO [db.]table [(c1, c2, c3)] select 列或者* from mysql('host:port', 'db', 'table_name', 'user', 'password')

可以自定义列类型，列数，使用clickhouse函数对数据进行处理，比如

select toDate(xx) from mysql("host:port","db","table_name","user_name","password")
create table as select from
CREATE TABLE [IF NOT EXISTS] [db.]table_name
ENGINE =Log
AS 
SELECT *
FROM mysql('host:port', 'db', 'article_clientuser_sum', 'user', 'password')

网友文章: http://jackpgao.github.io/2018/02/04/ClickHouse-Use-MySQL-Data/

不支持自定义列，参考资料里的博主写的 ENGIN=MergeTree 测试失败。

可以理解成 create table 和 insert into select 的组合

Altinity/clickhouse-mysql-data-reader

Altinity公司开源的一个python工具，用来从mysql迁移数据到clickhouse(支持binlog增量更新和全量导入)，但是官方readme和代码脱节，根据quick start跑不通。

## 创建表
clickhouse-mysql \

 --src-host=127.0.0.1 \

 --src-user=reader \

 --src-password=Qwerty1# \

 --table-templates-with-create-database \

 --src-table=airline.ontime > create_clickhouse_table_template.sql
## 修改脚本
vim create_clickhouse_table_template.sql
## 导入建表
clickhouse-client -mn  create_clickhouse_table_template.sql
## 数据导入
clickhouse-mysql \

 --src-host=127.0.0.1 \

 --src-user=reader \

 --src-password=Qwerty1# \

 --table-migrate \

 --dst-host=127.0.0.1 \

 --dst-table=logunified \

 --csvpool

官方文档: https://github.com/Altinity/clickhouse-mysql-data-reader#mysql-migration-case-1—migrate-existing-data

注意，上述三种都是从mysql导入clickhouse，如果数据量大，对于mysql压力还是挺大的。下面介绍两种离线方式(streamsets支持实时，也支持离线)

csv

## 忽略建表
clickhouse-client \

 -h host \

 --query="INSERT INTO [db].table FORMAT CSV"  test.csv

但是如果源数据质量不高，往往会有问题，比如包含特殊字符(分隔符，转义符)，或者换行。被坑的很惨。

自定义分隔符, --format_csv_delimiter="|"
遇到错误跳过而不中止， --input_format_allow_errors_num=10 最多允许10行错误, --input_format_allow_errors_ratio=0.1 允许10%的错误
csv 跳过空值(null) ，报 Code: 27. DB::Exception: Cannot parse input: expected , before: xxxx: (at row 69) ERROR: garbage after Nullable(Date): "8,002LINE FEED>0205" sed ' :a;s/,,/,\\N,/g;ta' |clickhouse-client -h host --query "INSERT INTO [db].table FORMAT CSV" 将 ,, 替换成 ,\N,
python clean_csv.py --src=src.csv --dest=dest.csv --chunksize=50000 --cols --encoding=utf-8 --delimiter=,

clean_csv.py参考我另外一篇032-csv文件容错处理

streamsets

streamsets支持从mysql或者读csv全量导入，也支持订阅binlog增量插入，参考我另外一篇 025-大数据ETL工具之StreamSets安装及订阅mysql binlog 。

本文只展示从mysql全量导入clickhouse

本文假设你已经搭建起streamsets服务

启用并重启服务

上传mysql和clickhouse的jdbc jar和依赖包

便捷方式，创建pom.xml，使用maven统一下载

project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
 modelVersion>4.0.0/modelVersion>
 groupId>com.anjia/groupId>
 artifactId>demo/artifactId>
 packaging>jar/packaging>
 version>1.0-SNAPSHOT/version>
 name>demo/name>
 url>http://maven.apache.org/url>
 dependencies>
 dependency>
 groupId>ru.yandex.clickhouse/groupId>
 artifactId>clickhouse-jdbc/artifactId>
 version>0.1.54/version>
 /dependency>
 dependency>
 groupId>mysql/groupId>
 artifactId>mysql-connector-java/artifactId>
 version>5.1.47/version>
 /dependency>
 /dependencies>
/project>

如果本地装有maven，执行如下命令

mvn dependency:copy-dependencies -DoutputDirectory=lib -DincludeScope=compile

所有需要的jar会下载并复制到lib目录下

然后拷贝到 streamsets /opt/streamsets-datacollector-3.9.1/streamsets-libs-extras/streamsets-datacollector-jdbc-lib/lib/ 目录下

重启streamsets服务

总结

以上所述是小编给大家介绍的mysql迁移到clickhouse的5种方法,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

您可能感兴趣的文章:

MySQL数据库迁移data文件夹位置详细步骤
Mysql的数据库迁移到另一个机器上的方法详解
oracle数据库迁移到MySQL的方法总结
mysql数据库迁移至Oracle数据库
MySQL数据库迁移快速导出导入大量数据
mysql Innodb表空间卸载、迁移、装载的使用方法
关于MySQL数据迁移--data目录直接替换注意事项的详解
mysql5.5数据库data目录迁移方法详解
mysql 备份与迁移数据同步方法
一次mysql迁移的方案与踩坑实战记录

标签：武威临汾湖北白银聊城云浮乌海湖南

巨人网络通讯声明：本文标题《浅析mysql迁移到clickhouse的5种方法》，本文关键词浅析,mysql,迁,移到,clickhouse,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《浅析mysql迁移到clickhouse的5种方法》相关的同类信息！

浅析mysql迁移到clickhouse的5种方法

数据迁移需要从mysql导入clickhouse, 总结方案如下，包括clickhouse自身支持的三种方式，第三方工具两种。 create table engin mysqlCREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]( name1 [type1]...

10-18

嘉兴市稳定高频外呼卡便宜

联通昨日召开2019年电话业绩发布会，联通董事长嘉兴市稳定高频外呼卡王晓初在接受记者采访时表示：联通决定不进行5G手机...

02-23

400固定电话怎么办理移动400电话怎么办理？

办理移动400电话业务，不仅线路稳定，信号强，而且通话质量相对较好，所以在三大运营商400电话中，移动400电话是大多数企...

01-13

南京手机外呼系统开发（南京外呼公司）

本文目录一览： 1、求保举好的手机外呼琐细？ 2、外呼琐细怎样料理？ 3、外呼琐细哪家公司做的好？ 4、哪些电话电话外呼...

11-25

MWC2013前瞻：GTI助推TD-LTE全球规模商用

作为全球移动通信产业内的晴雨表与风向标，一年一度的世界移动通信大会将会在本周正式与产业界见面。从目前已经透露的...

01-16

惠普笔记本重装Win7系统图文教程

惠普笔记本电脑怎么用U盘重新安装win7系统？又该如何设置U盘启动呢？想了解的用户快来看看下面的教程吧。步骤方法一、...

10-20

昆明建材专用电话机器人多少钱-哪家专业

昆明建材专用电话机器人多少钱基本上每一个人可以达到的工作量并不多，所以我们就需要雇佣更多的人工去进行相应的工作...

05-18

重庆400电话办理是免费的吗？（400电话办理的正规）

重庆400电话是免费吗？ 400电话不是免费的，但是拨打拨打方只花本地通话费。企业公布一个400电话号码，客户在全国任何一...

11-07

怎么推广电话机器人（如何推广机器人）

本文目录一览： 1、什么是电话营销机器人？电话营销机器人为我们带来了什么？2、智能互联时代，AI电销机器人成为必不可...

11-27

福州移动电销网络线路办理多少钱-价格靠谱

福州移动电销网络线路办理多少钱电销机器人的出现，可以说是必然现象。因为，随着中国人口红利消失，越来越多公司招不...

01-16

上海电话资费

网络电话互拨一般都是免费的，国内国际都一样；如果要达到手机或座机上，需要充值；但是效果要看网络环境好坏，相对于...

10-25

济南抗封呼叫系统报价-终于知道

济南抗封呼叫系统报价您可以选择批量导入文件或同步联系人，导入成功后，您可以自动依次拨号。电销电话app是一款简单好...

01-16

中山电销不封号app代理

中山电销不封号app代理电销APP防封越来越强逐渐可以实现自动拨打，将空号、关机、无人接听等自动过滤。利用防封电销软...

11-18

SUSE Linux Enterprise Server 设置防火墙开启ssh远程端口的方法

1、vi /etc/sysconfig/SuSEfirewall2 #编辑防火墙设置 FW_SERVICES_EXT_TCP= 22 #开启22端口 rcSuSEfirewall2 restart #重启防火墙 2、安装ssh zypper ...

10-20

龙岩民生电销卡（民生电销卡套餐）

本文目录一览：1、翼销售办理电话卡流程2、电销封卡的原因是?怎么解决?3、电销如何介绍民生京东puls联名卡翼销售办理电话...

07-10

安徽电商专用电话机器人办理-哪家强

安徽电商专用电话机器人办理所以，如何抬高电话营销中心的运营效率和降低运营成本也已成为摆在企业面前的另一个重要问...

05-17

MySQL查询中LIMIT的大offset导致性能低下浅析

前言我们大家都知道，mysql查询使用select命令，配合limit，offset参数可以读取指定范围的记录,但是offset过大影响查询性能的原...

10-18

电话经营销售系统真的能代替人工出卖吗？

2019年11月04日作家：于佳未; 根源：www.dianhuarobot.com ; 本作品为原创作品版权归作家一切任何情势连载请接洽作家; 跟着越来越...

10-30

400电话办理的费用是多少呢如何办理400电话费用

说到400电话，我相信很多人不会感到奇怪，因为现在有很多企业申请400电话，所以在生活中，400电话很常见，企业申请400电话...

01-13

400电话办理包含的费用主要有哪些？

电话沟通作为常用的通讯工具，对很多企业来说至关重要，平时我们在使用过程中也可以办理固定电话或者手机号码，当然现...

11-05

强讯科技为天津美莱整形整容医院打造录音系统

天津美莱是一家美容整形机构，在国内整形业可以说是数一数二的。与美莱的合作充分的体现了强讯的整体技术能力以及集成...

10-19

重庆的电销卡有哪些（重庆哪里可以买电话卡）

本文目录一览：1、连连科技手机卡是什么卡2、永川电销卡哪里可以办理3、请问重庆移动神州行有哪些资费?4、长城移动电话...

07-10

电话外呼录音系统（电话外呼录音系统怎么用）

本篇文章给大家谈谈电话外呼录音系统，以及电话外呼录音系统怎么用对应的知识点，希望对各位有所帮助，不要忘了收藏本...

05-17

潍坊外呼系统一般多少钱（外呼系统维护）

今日给各位共享潍坊外呼体系一般多少钱的常识，其间也会对外呼体系维护进行解说，假如能可巧处理你现在面对的问题，别...

05-18

asp下IP地址分段计算函数

IP地址分段计算 scriptlanguage="JScript"Runat="Server" functionIPDeCode(EIP){ varIp1,Ip2,Ip3,Ip4; Ip1=moveByteR(EIP0xff000000,3); Ip2=moveByteR(EIP0x00ff000...

10-18

北京外呼系统怎么办理（外呼管理流程）

本文目录一览： 1、团体可能措置赏罚外呼体系吗？ 2、外呼体系哪家好？ 3、外呼体系装置须要哪些用度？ 4、公司想装置外...

11-25

页面编码codepage=936和65001的区别

这个是表示网页所用编码的，比如 %@ codepage=936%简体中文 %@ codepage=950%繁体中文 %@ codepage=65001%UTF-8 一般用在网页的第一行，比...

10-18

400电话怎么办理最省钱还在为400电话申请发愁？那是因为你对代理商服务还不了解

400电话业务由国家电信部门统一管理，目前只有电信.移动.中国联通的三大运营商拥有运营虚拟电话主机业务的权限。但是企...

01-12

比较好用的电销卡办什么卡好些

比较好用的电销卡办什么卡好些电销卡是什么卡?对外行人来说，很多人不知道是哪一种电销卡，实际上，电销卡是由三大运...

12-16

哪家的呼叫中心系统好用

对于从事电销工作的人们来说，每天总会有那么一个节点是想提出离职冲动的，不是因为客户的负面情绪就是因为业绩的压力...

10-26

上海房产专用ai机器人什么价格-哪家专业？

上海房产专用ai机器人什么价格关键是看线路，线路稳定了，就可以作为电销系统公司长期使用的电销工具，现在做呼叫系统...

05-17

400个电话，能达到什么效果？

400个电话，能达到什么效果？在通信领域，有一种话费分摊服务很受欢迎，就是400话费。这种不向用户收取长途电话费用的...

08-14

草根站长究竟该如何寻找适合自己的创业项目

最近我的一些个人站长朋友出去上班了。这些朋友不是养活不了自己，而是可以把自己养活的很好，少的收入几千块，多的...

10-19

江西外呼系统软件哪家正规（免费的外呼系统软件）

本文目录一览： 1、网络电话外呼系统哪个好？2、手机外呼软件有哪些？哪个好？怎么收费3、哪些电话电话外呼系统比较好...

11-27

html5理解head_动力节点Java学院整理

HTML文档的head部分，通常包括指定页面标题，为搜索引擎提供关于页面本身的信息，加载样式表，以及加载JavaScript文件（出于...

10-16

移动系统的外呼app（移动联通外呼）

本文目录一览： 1、外呼软件有哪些？2、手机外呼软件有哪些？哪个好？怎么收费3、我们是个电销团队，最近想找一款自动...

11-27

怎么养手机卡不会封号？

对大部分电销行业的小伙伴们而言，几乎是没有要养手机卡号的意识的。一张电话卡又不用升级，又没有权重和信用度的审核...

12-03

服务外包发展迎来新机遇

今年9月27日，国务院正式批准《中国(上海)自由贸易试验区总体方案》，这一批复将极大推进上海乃至全国包括服务外包在内...

10-22

高德地图如何改店铺注册？高德地图如何改店铺地址注册？

高德地图注册店铺？地图上输入店铺信息、上传图片信息、营业执照高德地图怎么注册店铺位置？ 1.用手机打开高德地图...

11-26

江苏电销电话机器人哪家强（电话销售智能机器人哪家好）

本篇文章给大家谈谈江苏电销电话机器人哪家强，以及电话销售智能机器人哪家好对应的知识点，希望对各位有所帮助，不要...

03-01

常州防封系统安装

常州防封系统安装,常州防封系统安装办理,怎么安装常州防封系统电销防封系统，专为电销企业定制的封号解决方案支持批...

12-03

福州怎么申请400电话（福州的电话号码）

福州怎么申请400电话（福州的电话号码）作为一个发展迅速的城市，福州的企业越来越注重客户服务。其中，申请400电话（...

08-14

金融行业为什么要做短视频运营

自媒体时代的来临，各行各业都想利用短视频占领属于自己的一片市场，对于金融行业也是不例外。短视频在近年来受到了...

03-01

电销机器人二次开发（电销机器人开发搭建平台）

本文目录一览： 1、什么是电销机器人2、有谁用过电销机器人？哪个公司的比较好？3、电销机器人是什么呢？为什么现在越...

11-28

宿州防封电销系统不封号吗

宿州防封电销系统不封号吗从我开始做销售系统开始，每个客户都给我留下了深刻的印象！其中一个客户做软件销售，每天...

12-15

上海防封电销外呼线路办理商家-看这里

上海防封电销外呼线路办理商家而且数企的电销系统有运营商的多种品质高的防封线路，电销系统可以避免电销企业在高频外...

01-16

Python 统计数据集标签的类别及数目操作

看了大神统计voc数据集标签框后，针对自己标注数据集，灵活应用，感谢！看代码吧~ import reimport osimport xml.etree.ElementTree...

10-18

电销卡打电话那里办理

电销卡打电话那里办理电销卡是什么卡?对外行人来说，很多人不知道是哪一种电销卡，实际上，电销卡是由三大运营商授权...

12-16

德国公布5G资费标准，每月套餐约合人民币659元！

物联卡消息：德国宣布开通5G之后服务之后，近日，并又公布了5G资费标准，根据公布的信息来看，除了要购买5G手机外，每月...

10-13

巨人科技可以提供的服务有哪些

不同地方能够给我们提供的服务几乎是OK不同的，这样就要求你要提前对这里能够提供的服务都是有好的的认识，只有我们真...

05-15

ai电话机器人软件下载教程视频（ai电话机器人系统）

本文目录一览：1、学生机器人平台,软件怎么下载2、深圳中天智远科技有限公司机器人怎么下载app3、机器人编程软件和教程...

06-20

浅析mysql迁移到clickhouse的5种方法

10-18

本页收集关于浅析mysql迁移到clickhouse的5种方法的相关信息资讯供网民参考！

推荐文章

上一篇：Mysql自连接查询实例详解

下一篇：Mysql优化技巧之Limit查询的优化分析

一起分享吧