Obtenha atualizações recentes da Hortonworks por e-mail

Uma vez por mês, receba os mais recentes insights, tendências, informações analíticas e conhecimentos sobre Big Data.

cta

Comece a Usar

nuvem

Pronto para começar?

Baixar sandbox

Como podemos ajudá-lo?

fecharBotão Fechar
cta

Soluções de big data do Spark corporativo em escala

A Hortonworks entrega o Spark para implementações corporativas

nuvem Hortonworks é um líder. Leia o Forrester Wave.

Baixar relatório

Visão Geral

Apache™ Spark Overview

Hortonworks is unleashing the power of the Apache Spark big data processing framework for enterprise scale, unifying the capabilities of open enterprise Apache Hadoop® and the in-memory analytic capabilities of Apache Spark to maximize organizational value.

Spark is Better as Part of the Platform
Spark is certified as YARN-ready and is part of Hortonworks Data Platform. Memory and CPU-intensive enterprise Spark-based applications can coexist with other workloads deployed in a YARN-enabled cluster. Spark has first class support for external data sources, it can run directly on the cluster in YARN, and that is where enterprises want to perform their data analysis. This approach avoids the need to create and manage dedicated enterprise Spark clusters and allows for more efficient resource use within a single cluster. 

Spark Requires Enterprise-Grade Security and Governance
As part of the HDP platform, Spark has access to the same governance, security and management policies as other components of the HDP stack. The Spark big data processing framework is one the fastest moving projects in the Big Data ecosystem and its libraries remain at different levels of maturity. Hortonworks investigates, validates, certifies and then supports each of the components in the Spark project. This approach is key to the way we add value for our customers.

Notebooks Makes Spark and Data Science Easier to Consume & Share
Web-based notebooks bring data ingestion, exploration, visualization, sharing and collaboration capabilities to Hadoop and Spark. Hortonworks is making a substantial investment in Apache Zeppelin; we plan to make Zeppelin ready for production use by making it easier to use, while adding security, stability and R support.

By delivering a unified Apache Spark and Hadoop, we combine Spark-driven Agile Analytic workflows with the vast-data set and economics of Hadoop. With Hortonworks, enterprises can deploy the Apache Spark big data processing framework with the industry’s best security, governance, and operations capabilities.

QUAL É O FOCO DA HORTONWOKS NO SPARK?

Com o lançamento do Spark 1.6, a Hortonworks compromete-se a ajudar os clientes a acelerar a ciência de dados, manter o acesso de dados sem interrupções, impulsionar a inovação no núcleo.

Spark como parte do Open Enterprise Hadoop, capacita as organizações a escalar o Spark para valorizar a empresa.

administrador

Aceleração de Ciência de Dados

Aumente a produtividade da ciência de dados, melhorando o Apache Zeppelin e contribuindo com algoritmos Spark adicionais e pacotes para facilitar o desenvolvimento de soluções chave.

Por exemplo: Projeto Magellan – análise geoespacial no Apache Spark, uma biblioteca em código aberto para análises geoespaciais, que facilita consultas geoespaciais e baseia-se no Spark para resolver problemas difíceis que lidam com dados geoespaciais em grande escala.

administrador

Acesso a dados sem interrupção

O Spark SQL fornece APIs de estrutura de dados e SQL para acessar dados estruturados, enquanto o Spark Streaming permite aos desenvolvedores criar facilmente processamento de fluxo tolerante a falhas, escalável e de alto rendimento no que diz respeito a fluxos de dados ao vivo.

A Hortonworks vem aprimorando a integração do Spark com YARN, HDFS, Hive, HBase e ORC. Especificamente, acreditamos que podemos otimizar ainda mais o acesso aos dados por meio da nova API de fonte de dados.

administrador

Inove no núcleo

Permita o compartilhamento RDD com camada de memória HDFS

Contribua com algoritmos de aprendizagem automática adicional

Enhance enterprise Spark’s security, governance, operations, and readiness

cta

Para saber mais sobre todas as inovações do Spark,

CONFIRA NOSSA PÁGINA DO APACHE SPARK.

VER PÁGINA

COMO COMEÇAR COM O APACHE SPARK NA ESCALA?

Ouça o nosso recente webinar: Spark na escala com Hadoop