cta

Comece a Usar

nuvem

Pronto para começar?

Baixar sandbox

Como podemos ajudá-lo?

fecharBotão Fechar
cta

Noções básicas do Hortonworks Sandbox

nuvem Pronto para começar?

BAIXAR SANDBOX

O Hortonworks Sandbox é um ambiente Apache Hadoop® pessoal e portátil, que vem com vários tutoriais interativos Hadoop e os mais empolgantes avanços da comunidade Apache. Em 15 minutos tudo estará pronto e funcionando!

Faça o download do Sandbox

Visão Geral

Se você é novo no Hortonworks Sandbox e está usando as ferramentas em código aberto Apache para criar aplicativos de dados modernos, sugerimos que utilize os tutoriais a seguir.

Fundamentos do Sandbox

Começando a usar a HDP®

Comece sua viagem Apache Hadoop com este tutorial destinado a usuários com pouca experiência na utilização do Sandbox.
Explore o Sandbox em ambientes de máquinas virtuais e na nuvem, e aprenda a navegar pela interface do usuário do Apache Ambari.

Este tutorial apresenta uma seção que descreve os principais conceitos e uma série de tutoriais que mostram como mover dados para o HDFS, explorar os dados com SQL no Apache Hive, fazer transformações com o Apache Pig ou Apache Spark e, finalmente, gerar um relatório com o Apache Zeppelin.

Começando a usar a HDP

Tour de aplicação prática do Apache Spark em 5 minutos

Breve introdução ao Spark, criando um RDD para Wikipédia dentro de um bloco de anotações do Apache Zeppelin.

Depois de ter passado por este tutorial, você pode encontrar outros tutoriais Spark aqui:

Apache Spark em 5 minutos

Processamento de eventos IoT em tempo real

O Apache Hadoop geralmente é utilizado para processar dados não estruturados, novos tipos de dados ou dados em repouso na escala. No entanto, você também pode processar dados em movimento e este tutorial irá apresentá-lo a ferramentas como Apache NiFi, Apache Kafka e Apache Storm e Apache HBase.

Processamento de eventos IoT em tempo real

Aprendendo as regras do Apache NiFi

O NiFi proporciona a aquisição de dados, o processamento de eventos simples, transporte e mecanismo de entrega projetados para acomodar os diversos fluxos de dados gerados por um mundo de pessoas conectadas, sistemas e coisas. Neste tutorial, você aprenderá como o Apache Nifi conecta e conduz os dados de transporte streaming.

Apache NiFi

Use outros tutoriais

Outros tutoriais podem ser encontrados aqui:

O que há de novo na Hortonworks Data Platform 2.5

slides em parallax

Para trabalhadores de dados

  • Explore as APIs mais recentesA nova estratégia de distribuição da Hortonworks oferece rápidas inovações da comunidade Apache™ Hadoop® para você. A HDP agora é compatível com várias versões do Apache Hive (1.2 e 2.1) e do Apache Spark (1.6 e 2.0no mesmo cluster.

  • Velocidade SQL interativaConsulta interativa com Apache Hive LLAP. O LLAP permite analíticas SQL abaixo de um segundo no Hadoop armazenando de forma inteligente em cache na memória com servidores persistentes que instantaneamente processam consultas SQL.

  • Acesso remoto ao Apache Phoenix O Apache Phoenix agora vem com um novo Query Server que permite maior acesso e escolha de linguagens de desenvolvimento para acessar os dados armazenados no Apache HBase.

slides em parallax

Para operadores Hadoop

  • Advanced Visualization DashboardingAmbari 2.4 provides integrated log search and access capabilities. This enables operators to search, browse and filter their cluster operational logs for easier management. Also the integration of Grafana with Ambari brings the most important metrics front-and-center.

  • Integration of Comprehensive Security and Trusted GovernanceThe Apache Ranger and Apache Atlas integration allows enterprises to implement dynamic classification-based security policies. Using Ranger, administrators can define security policies based on Atlas metadata tags or attributes and apply this policy in real-time.

  • Streamlined Operations for Apache HBaseStreamlined backup and restore capabilities have been added to Apache HBase allowing operators to perform incremental backups. HBase operations have been simplified with improved HBase metrics in Ambari and set of pre-built dashboards.

slides em parallax

For Data Scientists

  • Simplifies DevelopmentApache Zeppelin provides a secure and collaborative web-based notebook for interactive data ingestion, exploration, and visualization for Apache Spark, Apache Hive and Apache Phoenix.

  • Seamless Data AccessImproved Apache Spark access to Apache Hive and Apache HBase. The Spark-HBase connector leverages Data Source API (SPARK-3247) introduced in Spark-1.2.0.

  • Apache Spark 2.0The most notable improvements in Apache Spark 2.0 are in the areas of API, Performance, Structured Streaming and SparkR. Achieve higher performance through a new Dataset API which is an extension of DataFrame API and also supports compile-time type checking.

Hortonworks Sandbox na nuvem

Hortonworks Sandbox na nuvem

Avalie fornecedores de nuvem que podem lhe ajudar a começar com o Hadoop usando requisitos mínimos do sistema.
Saiba Mais
Baixar o Hortonworks Sandbox em uma VM

Nada de data center, serviço de cloud nem conexão de internet! Controle total do ambiente. Amplie facilmente com componentes adicionais ou experimente as diversas versões de testes da Hortonworks. Sempre atualizado com a edição mais recente.

Utilize o Hortonworks Sandbox no Azure

O Azure oferece um jeito fácil de começar com o Hadoop usando requisitos mínimos do sistema. Trata-se de uma excelente solução caso sua máquina pessoal não atenda aos requisitos mínimos do sistema para execução local.