新一代版本集成了用于处理数据和流式数据的Spark,以及用于实时获取数据的Kafka
北京,2017年12月15日——Hitachi Vantara近日宣布推出新一代Pentaho数据集成和分析平台软件。新版Pentaho 8.0得到了全面增强,支持Spark和Kafka框架,能够显著改进数据和流式数据处理,并且能够实时将计算资源与业务需求轻松进行匹配。这一新版本旨在帮助客户从其数据中获取更大的价值,在提升竞争优势的同时,全面加速其数字化转型旅程。
独立调研公司IDC的研究显示,到2025年,全球数据量将增长至163ZB,比2016年生成的数据量高10倍还多。该公司还预测,其中超过四分之一的数据将为实时数据,而物联网数据将在其中占据95%以上。
随着Pentaho 8.0的发布,Hitachi Vantara可帮助客户更好地提升企业能力,通过优化和现代化其数据分析管道,以及改进其现有团队的工作效率,出色应对海量的实时数据。Pentaho 8.0平台的全新增强功能使用户能够:
· 改进到流式数据源的联接:随着数据移动速度的加快,及时处理数据并在必要时立即作出反应变得至关重要。Pentaho 8.0的新功能包括:
o 使用Spark处理流式数据:Pentaho 8.0现在可使用其原生引擎或Spark,获取和处理流式数据。这一功能的推出,进一步增强了当前Spark与SQL、MLlib和Pentaho的自适应执行层的集成。
o 联接到Kafka Stream:Kafka是一种非常受欢迎的发布/订阅消息系统,可处理当今大数据和物联网环境中常见的海量数据。Pentaho 8.0现在支持采用专门的步骤,联接Pentaho数据集成(PDI)与Kafka,以进行实时处理。
o 采用Knox实现大数据安全:Pentaho 8.0在针对Cloudera和Hortonworks的现有企业级安全基础之上,新增了Knox Gateway(用于对使用Hadoop服务的用户进行身份验证)支持。
● 优化处理资源:每个组织的数据处理资源均非常有限,需要智能地加以使用,以便即使在计算资源需求非常高的情况下,也能保证出色可用性。为支持这一目标,Pentaho 8.0提供了:
○ 支持横向扩展企业工作负载的Worker节点:IT经理现在可以轻松添加额外的节点,并在所有可用的计算资源之间分担并发工作负载,实现容量与需求的最佳匹配。这一匹配能力可在云与内部环境之间提供出色的弹性和可移植性,从而为最终用户带来更快、更有效的处理体验。
○ 自适应执行增强:Pentaho的自适应执行功能在Pentaho 7.1中首次推出,使用户能够将工作负载与最合适的处理引擎进行匹配,而无需重写任何数据集成逻辑。现在,Pentaho 8.0使得自适应执行功能更容易设置、使用且更安全。此功能现在也在Hortonworks上提供。
○ 对Avro和Parquet的原生支持:Pentaho 8.0包含Pentaho的可视化编辑工具,支持轻松读写主要的大数据文件格式,并使用Spark进行处理。
· 提高团队工作效率:Pentaho 8.0还具备多项新功能,能够显著提高整个数据管道的工作效率。这些功能包括用于准备数据的精细过滤器、改进的存储库可用性以及更轻松的应用审核功能等。
Hitachi Vantara公司Pentaho软件首席产品官Donna Prlich表示:“在数字化转型的道路上,企业必须充分利用他们可用的所有数据。这要求企业联接传统数据孤岛并集成其运营和信息技术,以建立起现代化的分析数据管道,最终建成一个更加互联、开放和流畅的数据环境。Pentaho 8.0提供了企业级高速处理能力,致力于帮助Hitachi客户更好地迎接未来的数字挑战,全面加速其数字化旅程。”
关于Hitachi Vantara
Hitachi Vantara是Hitachi集团旗下全资子公司,致力于利用数据驱动解决方案帮助企业发现和利用数据蕴藏的商业价值,开展智能创新,并帮助企业和社会取得有益成果。我们将技术、智慧和行业经验结合在一起,提供数据管理解决方案,帮助企业优化客户体验,开发新的业务收益,同时降低运营成本。只有Hitachi Vantara能够将信息技术(IT)、运营技术(OT)和行业经验完美融合,提升客户的创新优势,并与全球企业通力合作,利用数据实现卓越价值。了解更多信息,请访问:HitachiVantara.com