Tolerância a falhas em clusters geograficamente distribuídos baseado em troca de mensagens
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Católica do Salvador
Este artigo apresenta uma proposta de implementação de tolerância a falhas em
clusters geograficamente distribuídos baseado em troca de mensagens. Propõem-se um método tolerante a um tipo de falha – a desconexão de cluster remoto em uma CoHNOW (Collection of Heterogeneous Network of Workstations) utilizando-se apenas de características do padrão MPI 1.1 (Message Passing Interface). Esta proposta não se baseia em outros projetos de pesquisa que implementam técnicas clássicas de recuperação de falhas, tais como checkpoint, log e/ou através de modificações na semântica do padrão. A solução apresentada finalizou a execução mesmo ocorrendo uma falha através da desconexão física da interconexão entre os clusters geograficamente distribuidos sem incorrer em excessivo custo ao cômputo geral.
