Skip to content

Apresentação do SpatialHadoop no CLOSER 2017

Computação em Nuvem

O CLOSER (International Conference on Cloud Computing and Services ScienConsiderando que as tarifas deste tipo de serviço podem ser altas, oce) é uma importante conferência na área de computação em nuvem e a sétima edição aconteceu em abril de 2017, na cidade de Porto, Portugal.

O foco do evento é mostrar os avanços mais recentes sobre infraestrutura, operações e serviços disponíveis na Internet através da nuvem. Nosso artigo sobre SpatialHadoop foi aceito e fomos fazer a apresentação.

SpatialHadoop

A apresentação feita no CLOSER 2017 está disponível aqui. O título do artigo publicado é Cost Optimization on Public Cloud Provider for Big Geospatial Data, onde falamos sobre o SpatialHadoop.


O SpatialHadoop é um projeto baseado no Hadoop que oferece suporte a processamento de dados espaciais, ou seja, é uma ferramenta que une o Geographical Information System (GIS) e Big Data.

O processamento de dados geoespaciais no Hadoop é ineficiente em função das características do HDFS, que não premite acesso aleatório a um ponto específico dos dados. O SpatialHadoop resolve esse problema criando um índice intermediário, de forma análoga ao Lucene. Quando o usuário precisa pesquisar um mapa, o SpatialHadoop acessa índice, que entrega os dados rapidamente.

O dimensionamento dos recursos computacionais é um ponto complicado, se tornando especialmente crítico em ambientes de nuvem pública, uma vez que o superdimensionamento geralmente se reverte em dinheiro desperdiçado. O problema é o mesmo quando precisamos trabalhar com Hadoop. Definir o número mínimo de datanodes é uma tarefa confusa. Muitos datanodes são um problema de custo, enquanto que poucos datanodes trazem o problema da performance.

O objetivo do estudo é minimizar os custos de processamento de dados espaciais em larga escala nos provedores de nuvem pública. O trabalho conseguiu encontrar uma forma de combinar eficiência no processamento e custo final. O experimento usou o Open Street Map (OSM) como fonte de dados. No site do SpatialHadoop há vários datasets disponíveis.

Leave a Reply

Your email address will not be published. Required fields are marked *

Marco Reis
Privacy Overview

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.