Palestra - Sexta-feira, 06/09/2013

S É R I E   D E   S E M I N Á R I O S   DO  GRUPO  CROSS
 
Sexta-feira, 06/09/2013, às 16:00 horas
Sala MDC1
Guilherme José Henrique
Graduando em Ciência da Computação - UEL
 
CONSULTAS POR SIMILARIDADE EM UM AMBIENTE DISTRIBUÍDO
 
Os dados complexos, como dados multimídia e dados georreferenciados, se tornam mais importantes a cada dia e se proliferam com o passar do tempo. Essa explosão se torna um problema, pois maneiras convencionais que costumavam lidar com esse tipo de dado não estão mais suportando essa imensa carga. A partir disso, novas abordagens estão sendo usadas, geralmente envolvendo modelos de computação que rodam em grandes clusters, como exemplo, o paradigma de computação MapReduce. Esta palestra apresentará técnicas e algoritmos para lidar com grandes volumes de dados complexos de forma distribuída. Também será apresentada a implementação de uma estrutura de indexação armazenada no HDFS, o sistema de arquivos distribuído do Hadoop - software que implementa o MapReduce. Detalhes particulares, como cache de objetos Java, pool de threads e operações básicas do Hadoop também serão expostos.