当前位置:网站首页>CKAN教程之将 Snowflake 连接到 CKAN 以发布到开放数据门户
CKAN教程之将 Snowflake 连接到 CKAN 以发布到开放数据门户
2022-08-02 22:40:00 【知识大胖】
加利福尼亚州利用 CKAN 数据管理产品在加利福尼亚开放数据门户上为加利福尼亚公民提供来自政府部门的大量数据集。这些数据集是公开的,任何人都可以下载。当前状态详细说明了 State 如何通过 python 应用程序提取和加载数据。这个小型应用程序需要一个 Azure 虚拟机实例,该实例需要定期在线或手动打开才能提取和加载。这需要对他们希望避免的小型应用程序进行维护。在本文中,我详细介绍了如何使用外部函数将数据集从 Snowflake 直接推送到 CKAN。
当前状态
当前状态需要基础架构团队必须监控的托管服务器。为了避免与这个小型服务器相关的一些工作,团队有兴趣在 OpenGov 管理的 CKAN 服务器上建立一个更加原生的 Snowflake 连接。已部署的 python 代码定期运行,并由 Windows 操作系统任务触发。
python 代码每天检查一次更新并将数据上传到 CKAN。为此,python 代码从 Snowflake 中提取数据并将其作为 csv 放到本地文件系统中。然后一个字节流将数据推送到 CKAN。这意味着我们在 Snowflake 中有一个文件副本,在 python 服务器上有一个临时数据副本,在 CKAN 中有一个数据副本。流程中的每一步都在物理上移动数据。
未来状态
我们希望建立一个管道,尽可能多地从等式中移除基础设施。因此,我们将利用 Snowflake 作为我们的事实来源,并以某种直接的方式与 OpenGov 联系。作为外部
边栏推荐
猜你喜欢
VMware workstation 程序启动慢
Auto.js脚本程序打包
分库分表索引设计:二级索引、全局索引的最佳设计实践
万物智联时代,悄然走入生活
科研用Cholesterol-PEG-NHS,NHS-PEG-CLS,胆固醇-聚乙二醇-活性酯
JS Date 时间戳 getTune data.parse 倒计时小程序
# DWD层及DIM层构建## ,220801 ,
MySql查询某个时间段内的数据(前一周、前三个月、前一年等)
If the watermark according to how to realize the function
测试人生 | 阿里实习 90 天:从实习生的视角谈谈个人成长
随机推荐
用大白话解释“什么是ERP?” 看完这篇就全明白了
WebShell 木马免杀过WAF
测试人生 | 阿里实习 90 天:从实习生的视角谈谈个人成长
If the watermark according to how to realize the function
centos7安装mysql5.7步骤(图解版)
【使用pyside2遇到的问题】This application failed to start because no Qt platform plugin could be initialized.
程序员如何优雅地解决线上问题?
基于两级分解和长短时记忆网络的短期风速多步组合预测模型
Controller层代码这么写,简洁又优雅!
CTF命令执行题目解题思路
threejs 动态调整相机位置,使相机正好能看到对象
1 - vector R language self-study
Week 7 - Distributional Representations
RuoYi-App Startup Tutorial
00 -- jieba分词
MySql查询某个时间段内的数据(前一周、前三个月、前一年等)
VS保存后Unity不刷新
GameStop NFT 市场分析
Token、Redis实现单点登录
科研用Cholesterol-PEG-NHS,NHS-PEG-CLS,胆固醇-聚乙二醇-活性酯