本发明涉及通讯技术领域,尤其涉及一种基于可视化的数据流处理方法。
背景技术:
为了解决日益增长的实时数据处理需求,很多公司正在将其部分大数据基础架构转换为流式处理架构。传统的流数据处理主要通过编程的方式创建任务,对于一个新的任务通常需要经过繁琐的编码、编译、打包的过程。这种方式的工作效率低,可复用性不高,对于非编程人员来说难度颇大。
相比之下,可视化方式创建流处理任务的优势在于不需要编程就能完成,降低使用门槛,方便用户使用和管理,故有本发明的技术方案产生。
技术实现要素:
本发明要解决的技术问题,在于提供一种基于可视化的数据流处理方法,对于不同的流数据源,先将流数据源注册到流处理平台,再对该流数据源中的流数据加上数据结构定义。用户便可像操作关系型表一样操作流数据,可视化创建流处理任务一种是通过sql方式,另一种是通过拖拽配置方式,本发明采用的是sql方式,用户在可视化界面中配置并提交任务,系统通过用户提交的配置自动构建流处理任务,用户可以在任务管理、可视化界面中实时查看流处理结果和日志。
本发明的问题是这样实现的:
一种基于可视化的数据流处理方法,包括如下步骤:
步骤1、用户配置流数据源信息和流数据源的结构信息,并通过流数据源管理页面将配置好的流数据源信息和流数据源的结构信息提交到数据库;
步骤2、用户在可视化界面上创建流处理任务时,先通过可视化界面选择相应的流处理组件构建流处理任务并填写好各个流处理组件的输入信息,再配置流处理任务相应的执行参数,再将流处理任务、各个流处理组件的输入信息和执行参数提交到流处理任务构建引擎;
步骤3、流处理任务构建引擎解析各个流处理组件的输入信息,从而将流处理任务转化为sql语句;
步骤4、将执行参数、转化为sql语句的流处理任务和输入信息中的存储信息参数保存到数据库的执行计划表中等待执行引擎调度;
步骤5、执行引擎启动监控线程定时扫描执行计划表,获取流处理任务的执行参数,根据执行参数为待执行的流处理任务添加执行计划;
步骤6、流处理任务根据流数据源信息获取流数据,并根据流数据源的结构信息将流数据进行格式化,执行引擎根据定义的流数据源的结构在内存中为格式化的流数据创建虚拟表,并将格式化的流数据加入到虚拟表中,通过sql语句查询虚拟表,并根据执行计划定时对虚拟表内的流数据进行执行流处理任务,得到流处理结果;
步骤7、根据存储信息参数将流处理结果保存到对应的存储介质中。
进一步地,所述流处理组件包括sql编辑器、源选择器、数据过滤器、数据操作器、数据计算器和存储介质选择器;
所述sql编辑器用于将流处理任务编辑转化为sql语句;
所述源选择器用于在获取流数据时,根据流数据源信息选择某个流数据源来获取流数据;
所述数据过滤器用于在执行流处理任务过程中,将流数据进行过滤处理;
所述数据操作器用于在执行流处理任务过程中,将流数据进行分组、投影和关联操作;
所述数据计算器用于在执行流处理任务过程中,根据算法将流数据进行计算处理;
所述存储介质选择器用于在将执行结果保存到对应的存储介质时,根据存储信息参数选择某个存储介质进行存储。
进一步地,所述步骤6之后还包括:
步骤61、在执行引擎中为流处理任务创建任务管理表和操作日志表,在任务管理表中实时插入当前流处理任务的进度信息和控制信息进行查看当前流处理任务的进度以及控制当前流处理任务的启动、暂停或关闭;并将当前流处理任务的进度信息记录到操作日志表进行日志监控。。
进一步地,所述步骤7之后还包括:
步骤71、将存储介质中的流处理结果发送至可视化界面,通过可视化界面进行展示,展示的方式包括表格和图表。
本发明的优点在于:
1、可视化方式创建流处理任务,不需要编程就能完成,降低使用门槛,方便用户使用。
2、配套可视化操作功能,方便控制流处理任务启停,方便观测流处理结果及日志等。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明一种基于可视化的数据流处理方法的执行流程图。
具体实施方式
为使得本发明更明显易懂,现以一优选实施例,并配合附图作详细说明如下。
如图1所示,本发明的一种基于可视化的数据流处理方法,包括如下步骤:
步骤1、用户配置流数据源信息和流数据源的结构信息(数据源(datasource)是提供某种所需要数据的器件或原始媒体。顾名思义,数据的来源),流数据源是获取流数据的来源,用于指定从哪接入数据,包括从本地实时文件中接入、通过接口从业务系统服务器接入等,即从本地实时文件或业务系统服务器获取到源数据,而流数据源的结构是将流数据按照真实数据流格式填写其分隔符、字段名称、编码等结构信息;并通过流数据源管理页面将配置好的流数据源信息和流数据源的结构信息提交到数据库;
步骤2、用户在可视化界面上创建流处理任务时,流处理任务构建引擎的前端提供相应的流处理组件:sql编辑器、源选择器、数据过滤器、数据操作器(分组、投影、关联等)、数据计算器(sum、cpunt等)和存储介质选择器,用户先通过可视化界面在流处理任务构建引擎前端选择相应的流处理组件构建流处理任务并填写好各个流处理组件的输入信息,再配置流处理任务相应的执行参数,再将流处理任务、各个流处理组件的输入信息和执行参数提交到流处理任务构建引擎;
步骤3、流处理任务构建引擎后端通过解析各个流处理组件的输入信息,从而将流处理任务转化为sql语句,流处理任务以sql的形式保存;
步骤4、将执行参数、转化为sql语句的流处理任务和输入信息中的存储信息参数保存到数据库的执行计划表中等待执行引擎调度;
步骤5、执行引擎启动监控线程定时扫描执行计划表,获取流处理任务的执行参数,根据执行参数为待执行的流处理任务添加执行计划;
步骤6、流处理任务根据流数据源信息获取流数据,并根据流数据源的结构信息将流数据进行格式化,执行引擎根据定义的流数据源的结构在内存中为格式化的流数据创建虚拟表,并将格式化的流数据加入到虚拟表中,通过sql语句查询虚拟表,并根据执行计划定时对虚拟表内的流数据进行执行流处理任务,得到流处理结果;在执行引擎中为流处理任务创建任务管理表和操作日志表,在任务管理表中实时插入当前流处理任务的进度信息和控制信息进行查看当前流处理任务的进度以及控制当前流处理任务的启动、暂停或关闭;并将当前流处理任务的进度信息记录到操作日志表进行日志监控;
步骤7、根据存储信息参数将流处理结果保存到对应的存储介质中,将存储介质中的流处理结果发送至可视化界面,通过可视化界面进行展示,展示的方式包括表格和图表,通过选择条件展示表格信息,若选择的存储介质为数据流容器,可视化界面将实时呈现数据流容器中的流数据。
具体地,所述流处理组件包括sql编辑器、源选择器、数据过滤器、数据操作器、数据计算器和存储介质选择器;
所述sql编辑器用于将流处理任务编辑转化为sql语句;
所述源选择器用于在获取流数据时,根据流数据源信息选择某个流数据源来获取流数据;
所述数据过滤器用于在执行流处理任务过程中,将流数据进行过滤处理;
所述数据操作器用于在执行流处理任务过程中,将流数据进行分组、投影和关联操作;
所述数据计算器用于在执行流处理任务过程中,根据算法将流数据进行计算处理;
所述存储介质选择器用于在将执行结果保存到对应的存储介质时,根据存储信息参数选择某个存储介质进行存储。
本发明的优点如下:
1、可视化方式创建流处理任务,不需要编程就能完成,降低使用门槛,方便用户使用。
2、配套可视化操作功能,方便控制流处理任务启停,方便观测流处理结果及日志等。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
深圳坪山网站建设公司郴州网站优化公司哪家好黄石外包网站优化公司韶关教育网站seo优化衡阳咨询营销型网站优化网站优化排名推广使用兴田德润中山网站优化排名哪里好网站我优化有什么弊端优化网站不能做的事情长安电子网站优化哪个公司好常德网站优化收费标准网站诊断与优化实例分析跨境电商独立网站优化网站优化描述设置甘肃专业的网站关键词优化企业网站优化报价承诺守信内链优化对网站有什么作用东台网站优化哪家好做网站优化如何做鼓楼区网站优化费用巩义百度网站优化费用多少平凉网站优化价格如何做网站排名优化宜昌广东网站优化seo网站优化报价表优化网站顶贴易速达武汉网站seo优化推广品牌网站优化系统招商项目网站排名优化系统高端商务网站优化收费敦煌网站优化香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤