
此工具是该公司并购Hadoop快速部署工具供应商SequenceIQ的结晶,透过Docker容器技术,让企业可以公有云、私有云或任意支援Docker的IT环境,自动化部署Hadoop丛集。而Cloudbreak在最近正式释出2.7版了,同样依循HDP的跨云策略,让使用者使用单一工具,就能统一设定三大公有云的云端存储服务设定。现在可以支援的公有云存储服务,包含AWS S3、Azure Data Lake Store(ADLS)、Windows Azure Storage Blob (WASB) ,还有Google Cloud Storage(GCS)。在设定介面中,开发者利用既有Instance profile,就能从存储实例存取云端存储服务。
为了加强数据平台的安全性,Cloudbreak也结合Apache Knox专案,「将丛集打包在安全Gateway内」,Hortonworks表示,只有被使用者存取的丛集服务,才会与网络连线,藉此减少平台与外部网络的接触面。而这次Cloudbreak发布的新功能Dynamic Blueprints,让使用者的数据丛集能整合外部数据库或是LDAP。Hortonworks表示,只需单次操作,企业就可以设定外部存储认证及数据库。而这些设定,未来可以被汇出变成新设定模版,「减少使用一次性模版,让组态设定可以重复使用。」
除了正式功能外,这次Hortonworks也推出一个技术预览版功能,称为共用数据池服务(Data Lake Shared Services)。Hortonworks表示,利用这个功能,开发者可以定义Schema、资安管理政策、审核机制,将这些设定打包成一组共用服务,并且套用至各云端环境的工作负载。

Cloudbreak 2.7版现在可以支援的公有云存储服务,包含AWS S3、Azure Data Lake Store(ADLS)、Windows Azure Storage Blob (WASB) ,还有Google Cloud Storage(GCS)。在设定介面中,开发者利用既有Instance profile,就能从存储实例存取云端存储服务。之後,使用者还要设定新数据的存储位置。

图片来源:Hortonworks
为了加强数据平台的安全性,Cloudbreak结合Apache Knox专案,「将丛集打包在安全Gateway内」,Hortonworks表示,只有被使用者存取的丛集服务,才会与网络连线,藉此减少平台与外部网络的接触面。Cloudbreak也会动态判读Cluster blueprint,主动挑选出适合让使用者存取的系统服务。而此功能,也能支援单一登入(Single Sign On,SSO)认证机制。

图片来源:Hortonworks
这一次Cloudbreak也推出了新功能Dynamic Blueprints,让使用者的数据丛集能整合外部数据库或是LDAP。Hortonworks表示,只需一次操作,企业就可以完整设定外部存储认证及数据库。而这些设定,未来可以被汇出变成新设定样板,「减少一次性模版的出现,让组态设定可以重复使用。」Hortonworks表示。

图片来源:Hortonworks